тел: +7 926 225 25 07
Заказать расчёт
Закрыть

Dell NVIDIA H100

12 976 430 

Заказать расчёт
Артикул: deea76c5506a
Категория:
Бренд:

Два GPU NVIDIA H100 в одном сервере Dell — это не компромисс между ценой и мощностью, а осознанный выбор архитектуры. Платформа Dell PowerEdge R760xa в такой конфигурации дает 188 ГБ объединенной GPU-памяти через NVLink и делает инференс, дообучение и аналитику данных без избыточных трат на железо. Когда нагрузка вырастет — шасси расширяется до четырех H100 без замены корпуса. Для задач уровня полного тренинга крупных моделей ServerICT поставляет старшие конфигурации той же линейки: XE9640 на четырех SXM-ускорителях и XE9680 на восьми.

Платформы и технические параметры

ServerICT работает с тремя конфигурациями Dell под ускорители NVIDIA H100. Каждая рассчитана на свой класс задач — от управляемого инференса до полномасштабного тренинга.

R760xa: старт с двух H100 NVL, рост до четырех

Шасси R760xa занимает 2U в стойке и рассчитано на двуслотовые GPU с интерфейсом PCIe Gen5. Процессор — Intel Xeon Gold 6438Y+ с 32 ядрами, что дает достаточную пропускную способность для предобработки данных и управления потоками без узких мест со стороны CPU.

Ускоритель NVIDIA H100 NVL несет 94 ГБ памяти HBM2e при TDP 350–400 Вт. Два таких модуля, установленных в одном шасси, соединяются по NVLink и работают как единый домен на 188 ГБ. Это принципиально для инференса моделей, которые не помещаются на одну карту: данные передаются между GPU без участия CPU и системной шины.

Характеристики конфигурации R760xa + 2× H100 NVL:

  • GPU: 2× NVIDIA H100 NVL PCIe, по 94 ГБ HBM2e.
  • Объединенная GPU-память через NVLink: 188 ГБ.
  • CPU: Intel Xeon Gold 6438Y+, 32 ядра.
  • Форм-фактор: 2U Rack.
  • Слоты под GPU: до 4× двуслотовых PCIe Gen5 x16.
  • Охлаждение: воздушное.
  • Удаленное управление: iDRAC9 + OpenManage.

XE9640: четыре H100 SXM в жидкостном охлаждении

XE9640 — это 2U-платформа с жидкостным охлаждением CPU и GPU. Четыре ускорителя NVIDIA HGX H100 SXM по 80 ГБ HBM3 соединены через NVLink с суммарной пропускной способностью 900 ГБ/с. Общий объем GPU-памяти — 320 ГБ. Два процессора Intel Xeon Scalable 4-го или 5-го поколения дают до 64 ядер каждый. Оперативная память — до 2 ТБ DDR5 ECC в 32 слотах.

XE9680: восемь H100 SXM в стоечном 6U-корпусе

XE9680 — верхняя точка линейки. Восемь ускорителей NVIDIA HGX H100 SXM по 80 ГБ HBM3, объединенных через NVLink, дают 640 ГБ суммарной GPU-памяти. Два процессора Intel Xeon Scalable 5-го поколения до 64 ядер на CPU. ОЗУ — до 4 ТБ DDR5 ECC в 32 слотах. Хранилище — до восьми дисков NVMe 2.5″ с горячей заменой. Блоки питания — два по 2800 Вт с резервированием.

Технические параметры, одинаковые для всех трех платформ:

  • Архитектура GPU: NVIDIA Hopper с Transformer Engine 4-го поколения.
  • Форматы вычислений: FP64, FP32, TF32, BF16, FP16, FP8, INT8.
  • MIG: до 7 изолированных виртуальных экземпляров на каждый ускоритель.
  • Программный стек: CUDA, PyTorch, TensorFlow, TensorRT-LLM, vLLM, JAX.
  • Сеть: NVIDIA ConnectX-7, InfiniBand NDR, Ethernet 400 GbE.
  • Управление: iDRAC9 Enterprise, мониторинг GPU в реальном времени.
  • Защита: Silicon Root of Trust, TPM 2.0, System Lockdown.

Почему Dell, а не сборка из компонентов

Серверы Dell XE-линейки проектировались совместно с NVIDIA, а не собирались из готовых модулей под GPU. Это дает несколько практических преимуществ:

  • Во-первых, все конфигурации проходят заводскую валидацию на совместимость с конкретными версиями CUDA-стека, драйверов и NVIDIA AI Enterprise. Риск «необъяснимых» сбоев при добавлении нового GPU или обновлении драйвера существенно ниже, чем на нестандартных сборках.
  • Во-вторых, iDRAC9 Enterprise ведет мониторинг GPU — температуру, тактовую частоту, загрузку памяти, ошибки ECC — наравне с процессором и дисками. Все видно в одном интерфейсе без сторонних агентов. OpenManage автоматизирует обновление прошивок сразу на нескольких узлах, что важно при работе с кластером.
  • В-третьих, цепочка поставки Dell защищена на уровне прошивки: Silicon Root of Trust проверяет целостность загрузчика еще до старта ОС. Для компаний с требованиями к информационной безопасности это часто является обязательным условием закупки.

Где применяется

Инференс в продакшне. 188 ГБ объединенной памяти на R760xa превосходят большинство open-source моделей до 100B параметров без квантизации. MIG разделяет каждый ускоритель на независимые экземпляры, что позволяет одновременно держать несколько моделей в памяти с гарантированными ресурсами для каждой. Latency остается предсказуемой даже при пиковой нагрузке.

Дообучение и fine-tuning. LoRA и QLoRA на двух H100 NVL покрывают модели до 70B без ограничений по памяти. Transformer Engine переключает точность вычислений между FP8 и BF16 автоматически — это ускоряет тренинг без ручной настройки и без потери качества весов.

HPC и расчеты с двойной точностью. H100 PCIe дает до 51 TFLOPS в режиме FP64 Tensor Core. Молекулярная динамика, геофизические симуляции, финансовое моделирование — задачи, где раньше требовались отдельные HPC-узлы, теперь запускаются на той же платформе, что и AI-нагрузки.

Видеоаналитика и компьютерное зрение. Два H100 NVL справляются с несколькими потоками видео 4K одновременно. Это актуально для производственного контроля качества, медицинской диагностики по изображениям и систем видеонаблюдения с детекцией объектов.

Масштабирование до кластера. R760xa с четырьмя H100 PCIe объединяется с другими узлами через InfiniBand NDR или Ethernet 400 GbE. XE9640 и XE9680 поддерживают NVIDIA AI Enterprise без переработки программного стека — переход между конфигурациями не требует переписывать код или менять оркестратор.

Часто задаваемые вопросы

Можно ли добавить GPU позже?

R760xa изначально рассчитан на рост: шасси поддерживает до четырех двуслотовых GPU PCIe Gen5, кабели и слоты предусмотрены конструкцией. Добавление двух H100 NVL не требует замены корпуса. Если нагрузка вырастет до уровня восьми ускорителей, ServerICT помогут с переходом на XE9680 — варианты апгрейда обсуждаются с персональным менеджером.

Что входит в гарантийное сопровождение?

ServerICT выдает собственную гарантию на 12 месяцев — она не зависит от того, работает ли Dell официально на российском рынке. Каждая поставка идет с заводскими документами, таможенными актами и сертификатами. Постгарантийное обслуживание оформляется отдельным договором, условия согласовываются индивидуально.

Совместимость с AI-фреймворками?

H100 поддерживает полный стек CUDA 12.x, PyTorch, TensorFlow, TensorRT-LLM, vLLM, Triton, JAX. Для команд, которые работали на A100, миграция не требует изменений в коде — H100 обратно совместима на уровне CUDA. Инженеры MLOps-отдела ServerICT помогут развернуть окружение и настроить фреймворки под задачу.

Требования к питанию и охлаждению?

R760xa с двумя H100 NVL потребляет до 800–1000 Вт при полной нагрузке и работает с воздушным охлаждением — стандартная стойка ЦОД подходит без доработок. XE9640 с SXM-ускорителями требует жидкостного контура: перед заказом инженеры ServerICT проверят, что инфраструктура ЦОД соответствует требованиям.

Возможна ли кастомная конфигурация?

Да. ServerICT собирает конфигурации под конкретные задачи: объем ОЗУ, состав и количество NVMe-накопителей, сетевые карты, версия CPU. Доступна рассрочка платежа до 90 дней — условия обсуждаются индивидуально. Средний срок поставки составляет три недели, в большинстве случаев оборудование прибывает раньше.

Оставьте заявку или свяжитесь с менеджером ServerICT — получите расчет стоимости и точные сроки поставки сервера Dell с GPU NVIDIA H100 под вашу задачу.