тел: +7 926 225 25 07
Заказать расчёт
Закрыть

Supermicro A100 Nvidia

5 272 790 

Заказать расчёт
Артикул: 9267a5acf6b4
Категория:
Бренд:

Платформы Supermicro под NVIDIA A100 — это зрелая и хорошо отлаженная инфраструктура для AI и HPC. Supermicro разрабатывал эти серверы совместно с NVIDIA: архитектура шасси, топология NVLink и система охлаждения проектировались именно под ускорители A100 SXM4, а не адаптировались постфактум.

Модели и технические параметры

На странице доступны четыре конфигурации под разные задачи и бюджеты:

  • AS-2124GQ-NART — 2U с 4× A100 80GB. Компактная платформа на AMD EPYC 7502 (32 ядра, 2,5 ГГц, TDP 180 Вт). Четыре ускорителя NVIDIA HGX A100 SXM4 по 80 ГБ HBM2e, связанных через NVLink v3 с суммарной пропускной способностью 2,4 ТБ/с. Суммарная GPU-память — 320 ГБ. ОЗУ — 1 ТБ DDR4 ECC в 16 слотах. Питание — 2200 Вт с резервированием.  
  • AS-4124GO-NART — 4U с 8× A100 80GB. Флагманная конфигурация на том же EPYC 7502. Восемь ускорителей A100 SXM4 объединены через NVLink v3 и NVSwitch — суммарно 640 ГБ HBM2e GPU-памяти и 2,4 ТБ/с пропускной способности. ОЗУ — 1 ТБ DDR4 ECC. Питание — 2880 Вт с резервированием. 
  • SYS-420GP-TNAR — 4U с 8× A100 на Intel Xeon. Платформа на Intel Xeon ICX 4310 (12 ядер, 2,1 ГГц, TDP 120 Вт). Восемь ускорителей A100 80GB в форм-факторе PCIe. Хранилище — Samsung PM9A3 NVMe 960 ГБ.  
  • S-SYS-A100-1-64G — конфигурация на Intel Xeon 6348. Процессор Intel Xeon ICX 6348 (28 ядер, 2,6 ГГц), 64 ГБ DDR4 ECC, питание 3000 Вт + 2700 Вт.  

Технические параметры, общие для платформ AS-серии:

  • Архитектура GPU: NVIDIA Ampere, Tensor Core 3-го поколения.
  • Форматы вычислений: FP64, FP32, TF32, BF16, FP16, INT8, INT4.
  • MIG: до 7 изолированных экземпляров на каждый A100.
  • Топология сети: 1:1 GPU-NIC для GPUDirect RDMA.
  • PCIe: 8× PCIe 4.0 x16 через PCIe Switch.
  • Управление: Supermicro BMC, IPMI 2.0.
  • Поддержка: CUDA, TensorRT, PyTorch, TensorFlow, JAX, RAPIDS.

Чем платформа отличается от конкурентов? 

Платформы выделаются среди других серверов того же класса за счет следующих инженерных решений:

  • Топология 1:1 GPU-NIC. В обеих A+ Server платформах каждый из восьми A100 получает выделенный сетевой контроллер. При распределенном обучении на нескольких узлах это устраняет конкуренцию за сетевую пропускную способность и снижает задержки при передаче градиентов.
  • Двухуровневая компоновка шасси AS-4124GO. Процессор, память и накопители размещены в верхнем отсеке, GPU-сборка HGX — в нижнем. Два независимых температурных контура позволяют охлаждать CPU и GPU раздельно, что повышает стабильность при круглосуточной нагрузке.
  • Масштабируемость от 4 до 8 GPU в одном шасси. AS-2124GQ закрывает задачи, где достаточно четырех A100 и важна компактность 2U. AS-4124GO удваивает вычислительный ресурс при той же глубине стойки. Оба сервера объединяются в кластеры через InfiniBand с GPUDirect RDMA.

Дополнительные возможности GPU Supermicro:

  • До 8 ТБ DDR4 ECC в 32 слотах (максимальная конфигурация AS-серии).
  • 6 отсеков NVMe Hot Swap + возможность расширения до 10 дисков.
  • Питание уровня Platinum или Titanium с горячей заменой.
  • AIOM-слоты под гибкие сетевые карты OCP 3.0.

Производитель устанавливает гарантию 3 года на серверы и накопители.

Задачи, под которые выбирают платформу

variant

A40 Nvidia, L4 Nvidia, S-A100-2124GQ-4-80GB, S-A100-4124GO-8-80GB, S-A100-420GP-8-80GB, S-SYS-A100-1-64G

Бренд

ASUS, Dell

CPU

AMD EPYC 9554 (4-го поколения Genoa), до 96 ядер на процессор, 3.6+ ГГц, TDP до 360 Вт

Варианты CPU

28core 2.6G Intel 6348, AMD EPYC 7502 (32 ядра, 2.5 ГГц, TDP 180 Вт), Intel Xeon ICX 4310, 12 ядер / 24 потока, частота 2.1 ГГц, кэш 18M, пропускная способность 10.4GT/s, мощность 120W, сокет 4189.

Количество CPU

2

kolichestvoplanok

8

Количество GPU

4, 8

GPU (Nvidia)

NVIDIA A100