Перейти к основному содержанию

Национальный суперкомпьютерный кластер «Alem.Cloud» вошел в рейтинг самых мощных вычислительных систем планеты

Национальный суперкомпьютер «Alem.Cloud» занял 86 место в международном рейтинге самых мощных вычислительных систем мира – TOP500. В рейтинг включаются только те кластеры, которые проходят независимое тестирование по стандарту HPL (High-Performance Linpack), глобальному эталону вычислительной мощности.

Национальный суперкомпьютерный кластер «Alem.Cloud» был создан по поручению Главы государства на базе инфраструктуры АО «НИТ» Министерства искусственного интеллекта и цифрового развития. Суперкомпьютер предназначен для реализации проектов в области искусственного интеллекта, высокопроизводительных вычислений и анализа больших данных.

Архитектура кластера развернута на базе 64 серверов HPE Cray, объединенных в единый высокоплотный GPU-комплекс. Каждый вычислительный узел оснащён современными ускорителями NVIDIA H200, а для межузловогообмена используется высокоскоростная сеть 400 GbE / RoCE v2, обеспечивающая минимальные задержки и высокую пропускную способность, что особенно важно для масштабных HPL-нагрузок и распределённого обучения моделей.

86 место в рейтинге TOP500 подтверждает, что Казахстан на мировом уровне обладает мощной научно-технологической инфраструктурой и большим потенциалом для развития собственных AI-моделей. Это открывает перед страной возможности для проведения прорывных исследований, а также организации экспорта цифровых услуг и технологий в будущем.

Система обеспечивает производительность в диапазоне десятков петафлопс, что делает «Alem.Cloud» самой мощной вычислительной платформой Казахстана и Центрально-Азиатского региона.

Программное обеспечение суперкомпьютера использует передовые технологии корпоративного уровня:

  • SUSE Harvester – платформа гиперконвергированной инфраструктуры (HCI) и виртуализации GPU-узлов на базе KVM;
  • SUSE Rancher – централизованная платформа управления Kubernetes-кластерами и AI-нагрузками;
  • Kubernetes – основа для контейнеризации и оркестрации вычислительных задач машинного обучения;
  • Поддержка AI-фреймворков и распределённых стэков: PyTorch, TensorFlow, JAX, NCCL, UCX/UCC, MPI.

При подготовке комплекса к тестированию были выполнены:

  • оптимизация NUMA и CPU/GPU affinity;
  • настройка RDMA-каналов RoCE v2;
  • оптимизация межузлового взаимодействия и параметров HPL;
  • калибровка GPU-параллелизма для максимальной производительности.

Безопасность суперкомпьютера построена на современных принципах Zero-Trust:

  • SUSE NeuVector – защита контейнерной среды, сетевые политики, контроль рантайма;
  • Palo Alto Networks – сегментация сети, межсетевой экран нового поколения, защита периметра и межзонных коммуникаций;
  • Thales – криптографические решения и аппаратные модули для безопасного управления ключами и шифрования данных.

Ранее технические специалисты АО «НИТ» совместно с международными партнерами провели комплексное тестирование по методологии HPL (Linpack). Цель теста – замер производительности системы и подтверждение ее готовности к подаче в рейтинг TOP500. По итогам данного теста суперкомпьютер достиг показателей, которые и позволили Казахстану официально подать заявку для включения в глобальный рейтинг TOP500.