Платформы Supermicro под NVIDIA A100 — это зрелая и хорошо отлаженная инфраструктура для AI и HPC. Supermicro разрабатывал эти серверы совместно с NVIDIA: архитектура шасси, топология NVLink и система охлаждения проектировались именно под ускорители A100 SXM4, а не адаптировались постфактум. ServerICT поставляет несколько конфигураций — от компактных 2U с четырьмя GPU до полноразмерных 4U с восемью картами и процессорами AMD EPYC или Intel Xeon на выбор.
Модели и технические параметры
На странице доступны четыре конфигурации под разные задачи и бюджеты:
- AS-2124GQ-NART — 2U с 4× A100 80GB. Компактная платформа на AMD EPYC 7502 (32 ядра, 2,5 ГГц, TDP 180 Вт). Четыре ускорителя NVIDIA HGX A100 SXM4 по 80 ГБ HBM2e, связанных через NVLink v3 с суммарной пропускной способностью 2,4 ТБ/с. Суммарная GPU-память — 320 ГБ. ОЗУ — 1 ТБ DDR4 ECC в 16 слотах. Питание — 2200 Вт с резервированием.
- AS-4124GO-NART — 4U с 8× A100 80GB. Флагманная конфигурация на том же EPYC 7502. Восемь ускорителей A100 SXM4 объединены через NVLink v3 и NVSwitch — суммарно 640 ГБ HBM2e GPU-памяти и 2,4 ТБ/с пропускной способности. ОЗУ — 1 ТБ DDR4 ECC. Питание — 2880 Вт с резервированием.
- SYS-420GP-TNAR — 4U с 8× A100 на Intel Xeon. Платформа на Intel Xeon ICX 4310 (12 ядер, 2,1 ГГц, TDP 120 Вт). Восемь ускорителей A100 80GB в форм-факторе PCIe. Хранилище — Samsung PM9A3 NVMe 960 ГБ.
- S-SYS-A100-1-64G — конфигурация на Intel Xeon 6348. Процессор Intel Xeon ICX 6348 (28 ядер, 2,6 ГГц), 64 ГБ DDR4 ECC, питание 3000 Вт + 2700 Вт.
Технические параметры, общие для платформ AS-серии:
- Архитектура GPU: NVIDIA Ampere, Tensor Core 3-го поколения.
- Форматы вычислений: FP64, FP32, TF32, BF16, FP16, INT8, INT4.
- MIG: до 7 изолированных экземпляров на каждый A100.
- Топология сети: 1:1 GPU-NIC для GPUDirect RDMA.
- PCIe: 8× PCIe 4.0 x16 через PCIe Switch.
- Управление: Supermicro BMC, IPMI 2.0.
- Поддержка: CUDA, TensorRT, PyTorch, TensorFlow, JAX, RAPIDS.
Чем платформа отличается от конкурентов?
Платформы выделаются среди других серверов того же класса за счет следующих инженерных решений:
- Топология 1:1 GPU-NIC. В обеих A+ Server платформах каждый из восьми A100 получает выделенный сетевой контроллер. При распределенном обучении на нескольких узлах это устраняет конкуренцию за сетевую пропускную способность и снижает задержки при передаче градиентов.
- Двухуровневая компоновка шасси AS-4124GO. Процессор, память и накопители размещены в верхнем отсеке, GPU-сборка HGX — в нижнем. Два независимых температурных контура позволяют охлаждать CPU и GPU раздельно, что повышает стабильность при круглосуточной нагрузке.
- Масштабируемость от 4 до 8 GPU в одном шасси. AS-2124GQ закрывает задачи, где достаточно четырех A100 и важна компактность 2U. AS-4124GO удваивает вычислительный ресурс при той же глубине стойки. Оба сервера объединяются в кластеры через InfiniBand с GPUDirect RDMA.
Дополнительные возможности GPU Supermicro:
- До 8 ТБ DDR4 ECC в 32 слотах (максимальная конфигурация AS-серии).
- 6 отсеков NVMe Hot Swap + возможность расширения до 10 дисков.
- Питание уровня Platinum или Titanium с горячей заменой.
- AIOM-слоты под гибкие сетевые карты OCP 3.0.
Производитель устанавливает гарантию 3 года на серверы и накопители.
Задачи, под которые выбирают платформу
Тренинг нейросетей средней сложности
Четыре A100 с 320 ГБ суммарной HBM2e-памяти перекрывают большинство моделей до 30B параметров без шардинга. Восемь карт с 640 ГБ дают запас под более крупные архитектуры или несколько параллельных экспериментов.
Продакшн-инференс через MIG
Каждый A100 нарезается на семь изолированных экземпляров по 10 ГБ. На восьми картах это 56 независимых виртуальных GPU — схема, которую используют облачные провайдеры для мультитенантного сервиса без пересечений между клиентами.
HPC с двойной точностью
19,5 TFLOPS FP64 Tensor Core на каждом A100 закрывают молекулярную динамику, геофизику и квантовую химию. Это один из немногих GPU, где FP64 не урезан относительно FP32, что критично для верифицируемых научных расчетов.
Аналитика больших данных
RAPIDS на восьми A100 ускоряет SQL-запросы и ETL-пайплайны на терабайтных датасетах. Прямое соединение NVMe через PCIe Switch сокращает задержки при загрузке данных в GPU-память.
Виртуализация рабочих мест
NVIDIA vGPU на базе A100 дает специалистам по Data Science виртуальные рабочие станции с гарантированными ресурсами GPU и аппаратной изоляцией через MIG.
Часто задаваемые вопросы
Какие варианты конфигураций доступны?
Четыре модели с разным числом GPU и процессорными платформами: AS-2124GQ-NART (4× A100, AMD EPYC, 2U), AS-4124GO-NART (8× A100, AMD EPYC, 4U), SYS-420GP-TNAR (8× A100 PCIe, Intel Xeon, 4U) и S-SYS-A100-1-64G (Intel Xeon 6348). Состав накопителей, объем RAM и сетевые карты согласовываются при заказе.
Можно ли расширить память и количество GPU?
Объем ОЗУ масштабируется до 8 ТБ DDR4 ECC в 32 слотах для AS-серии. Количество GPU фиксировано конструкцией шасси — 4 или 8. Горизонтальный рост строится через добавление узлов и объединение по InfiniBand; ServerICT проектируют такие кластеры под ключ.
Как организовано гарантийное обслуживание?
Производитель Supermicro предоставляет 3-летнюю гарантию на серверы и накопители. ServerICT дополнительно выдают собственную гарантию на 12 месяцев, действующую независимо от официального присутствия вендора в России. Постгарантийное сопровождение — по отдельному договору.
Совместим ли сервер с моим ПО для AI?
A100 поддерживает полный стек NVIDIA: CUDA 12.x, PyTorch, TensorFlow, TensorRT, JAX, vLLM, RAPIDS, NVIDIA AI Enterprise. Инженеры MLOps-отдела ServerICT помогут с развертыванием окружения после доставки.
Как быстро осуществляется поставка?
Средний срок — три недели. Перед отправкой ServerICT фиксируют комплектность фотоотчетом с завода. Доступна рассрочка платежа до 90 дней, условия обсуждаются индивидуально.
Чтобы сравнить конфигурации по задачам и получить расчет стоимости с учетом актуального курса валют — напишите менеджеру ServerICT или оставьте заявку, ответим в течение рабочего дня.







