Российский суперкомпьютер «Говорун» получил новые узлы «РСК Экзастрим ИИ» с NVIDIA H100 и уникальной системой жидкостного охлаждения
- AlexT
- 09-июл-2025, 11:00
- 0 комментариев
- 11 просмотров
В Лаборатории информационных технологий им. М.Г. Мещерякова ОИЯИ (Дубна) завершён очередной этап модернизации суперкомпьютера «Говорун». На этот раз в вычислительный комплекс установили два новейших сервера собственной разработки — «РСК Экзастрим ИИ», оснащённых восьми ускорителями NVIDIA H100 и фирменной системой прямого жидкостного охлаждения (СЖО) от ГК РСК.
Каждый новый сервер выполнен в 2U-формате (912 × 508 × 88 мм) и рассчитан на решение ресурсоёмких задач в области ИИ и машинного обучения. Основные характеристики узла впечатляют:
2 процессора Intel Xeon Platinum Sapphire Rapids или Emerald Rapids (в «Говоруне» установлены Xeon Platinum 8468 — 48 ядер/96 потоков, частота 2,1–3,8 ГГц);
8 ускорителей NVIDIA H100 (или H200 NVL, PCIe) с объединением через NVLink-мосты;
До 2 Тбайт DDR5 DIMM (в «Говоруне» — 1 Тбайт ОЗУ);
NVMe SSD E1.S объёмом до 128 Тбайт + загрузочный M.2 NVMe SSD;
Четыре адаптера Mellanox ConnectX с совокупной пропускной способностью до 800 Гбит/с;
Локальная подсистема хранения «тёплых данных» с поддержкой GPUDirect Storage для ускоренной передачи между хранилищем и памятью GPU;
Возможность масштабирования через дополнительные пары ускорителей или подключение внешних JBOF-хранилищ.
Особая гордость узла — фирменная СЖО РСК, которая гарантирует эффективный отвод тепла при работе на максимальных нагрузках. Высокая плотность монтажа и продуманная система охлаждения позволяют компактно размещать до 21 сервера в одном шкафу, достигая пиковых 4,26 Пфлопс FP64.
Два установленных узла увеличили пиковую производительность GPU-компоненты «Говоруна» на 36 %, доведя её до 1,4 Пфлопс, а суммарная FP64-производительность всего комплекса теперь составляет 2,2 Пфлопс.
В конце 2024 года суперкомпьютер получил два дополнительных узла хранения RSC Tornado AFS ёмкостью 1 Пбайт каждый. Внутри — серверные платы с процессорами Intel Xeon Sapphire Rapids и коммутаторы PCIe 4.0. Такая архитектура позволила установить по два адаптера интерконнекта с пропускной способностью 200 Гбит/с каждый.
Поддержка технологии GPUDirect Storage (GDS) обеспечивает прямую передачу данных между СХД и памятью ускорителей, что критически важно для высокопроизводительных вычислений и работы с большими объёмами данных. Неудивительно, что СХД «Говоруна» входит в мировой рейтинг IO500 среди самых производительных хранилищ.
Ключевой элемент управления — интегрированный программный комплекс «РСК БазИС 4» и модуль «РСК БазИС СХД», включённый в реестр российского ПО. Микроагентная архитектура позволяет гибко управлять компонентами суперкомпьютера и создавать гиперконвергентные решения для HPC, анализа больших данных и облачных сервисов.
Модернизация суперкомпьютера «Говорун» с использованием «РСК Экзастрим ИИ» демонстрирует потенциал российских инженерных решений в области высокопроизводительных вычислений, машинного обучения и искусственного интеллекта. Новые узлы с NVIDIA H100, продвинутая СЖО и современное СХД делают «Говорун» одной из самых передовых вычислительных платформ в стране.