Национальный суперкомпьютерный кластер «Alem.Cloud» вошел в рейтинг самых мощных вычислительных систем планеты
Национальный суперкомпьютер «Alem.Cloud» занял 86 место в международном рейтинге самых мощных вычислительных систем мира – TOP500. В рейтинг включаются только те кластеры, которые проходят независимое тестирование по стандарту HPL (High-Performance Linpack), глобальному эталону вычислительной мощности.
Национальный суперкомпьютерный кластер «Alem.Cloud» был создан по поручению Главы государства на базе инфраструктуры АО «НИТ» Министерства искусственного интеллекта и цифрового развития. Суперкомпьютер предназначен для реализации проектов в области искусственного интеллекта, высокопроизводительных вычислений и анализа больших данных.
Архитектура кластера развернута на базе 64 серверов HPE Cray, объединенных в единый высокоплотный GPU-комплекс. Каждый вычислительный узел оснащён современными ускорителями NVIDIA H200, а для межузловогообмена используется высокоскоростная сеть 400 GbE / RoCE v2, обеспечивающая минимальные задержки и высокую пропускную способность, что особенно важно для масштабных HPL-нагрузок и распределённого обучения моделей.
86 место в рейтинге TOP500 подтверждает, что Казахстан на мировом уровне обладает мощной научно-технологической инфраструктурой и большим потенциалом для развития собственных AI-моделей. Это открывает перед страной возможности для проведения прорывных исследований, а также организации экспорта цифровых услуг и технологий в будущем.
Система обеспечивает производительность в диапазоне десятков петафлопс, что делает «Alem.Cloud» самой мощной вычислительной платформой Казахстана и Центрально-Азиатского региона.
Программное обеспечение суперкомпьютера использует передовые технологии корпоративного уровня:
- SUSE Harvester – платформа гиперконвергированной инфраструктуры (HCI) и виртуализации GPU-узлов на базе KVM;
- SUSE Rancher – централизованная платформа управления Kubernetes-кластерами и AI-нагрузками;
- Kubernetes – основа для контейнеризации и оркестрации вычислительных задач машинного обучения;
- Поддержка AI-фреймворков и распределённых стэков: PyTorch, TensorFlow, JAX, NCCL, UCX/UCC, MPI.
При подготовке комплекса к тестированию были выполнены:
- оптимизация NUMA и CPU/GPU affinity;
- настройка RDMA-каналов RoCE v2;
- оптимизация межузлового взаимодействия и параметров HPL;
- калибровка GPU-параллелизма для максимальной производительности.
Безопасность суперкомпьютера построена на современных принципах Zero-Trust:
- SUSE NeuVector – защита контейнерной среды, сетевые политики, контроль рантайма;
- Palo Alto Networks – сегментация сети, межсетевой экран нового поколения, защита периметра и межзонных коммуникаций;
- Thales – криптографические решения и аппаратные модули для безопасного управления ключами и шифрования данных.
Ранее технические специалисты АО «НИТ» совместно с международными партнерами провели комплексное тестирование по методологии HPL (Linpack). Цель теста – замер производительности системы и подтверждение ее готовности к подаче в рейтинг TOP500. По итогам данного теста суперкомпьютер достиг показателей, которые и позволили Казахстану официально подать заявку для включения в глобальный рейтинг TOP500.







