Skip to main content

«Alem.Cloud» ұлттық суперкомпьютерлік кластері әлемдегі ең қуатты есептеу жүйелерінің рейтингіне енді

«Alem.Cloud» ұлттық суперкомпьютері әлемдегі ең қуатты есептеу жүйелерінің халықаралық рейтингі – TOP500 тізімінде 86-орынға ие болды. Бұл рейтингке тек HPL (High-Performance Linpack) стандарты бойынша тәуелсіз тестілеуден өткен кластерлер ғана қосылады. HPL – әлемдік деңгейде есептеу қуатын өлшеудің эталоны болып саналады.

Ұлттық суперкомпьютерлік кластер «Alem.Cloud» Мемлекет Басшысының тапсырмасымен, ЖИ және цифрлық даму министрлігінің «Ұлттық ақпараттық технологиялар» АҚ инфрақұрылымы базасында іске қосылды. Суперкомпьютер жасанды интеллект, жоғары өнімді есептеулер және үлкен деректерді талдау саласындағы жобаларды жүзеге асыруға арналған.

Кластер архитектурасы 64 HPE Cray серверінің негізінде құрылып, біртұтас жоғары тығыздықтағы GPU-комплекс ретінде біріктірілген. Әрбір есептеу түйіні заманауи NVIDIA H200 жеделдеткіштерімен жабдықталған, ал түйіндер арасындағы деректер алмасу үшін 400 GbE / RoCE v2 жоғары жылдамдықты желісі қолданылады. Ол төмен кідірісті және жоғары өткізу қабілетін қамтамасыз етіп, ауқымды HPL-жүктемелер мен үлестірілген модельдерді оқыту үшін аса маңызды рөл атқарады.

TOP500 рейтингіндегі 86-орын Қазақстанның ғылым мен технологияда заманауи инфрақұрылымға ие екенін және ұлттық AI-модельдерді дамытуда жоғары әлеуеті бар екенін дәлелдейді. Бұл елімізге жаңа зерттеулер жүргізу, сондай-ақ болашақта цифрлық қызметтер мен технологияларды экспорттауға мүмкіндік ашады.

Суперкомпьютердің өнімділігі ондаған петафлопс деңгейіне жетеді – бұл «Alem.Cloud»-ты Қазақстан мен Орталық Азиядағы ең қуатты есептеу платформасына айналдырады.

Суперкомпьютердің бағдарламалық жасақтамасы корпоративтік деңгейдегі заманауи технологияларды қолданады:

  • SUSE Harvester – KVM негізіндегі гиперконвергентті инфрақұрылым (HCI) және GPU түйіндерін виртуалдандыру платформасы;
  • SUSE Rancher – Kubernetes-кластерлерін және AI-жүктемелерін орталықтандырып басқару платформасы;
  • Kubernetes – машиналық оқыту есептерін контейнерлеу және оркестрациялау негізі;
  • AI-фреймворктері мен үлестірілген технологияларды қолдау: PyTorch, TensorFlow, JAX, NCCL, UCX/UCC, MPI.

Тестілеуге кешенді дайындау барысында мына жұмыстар орындалды:

  • NUMA және CPU/GPU affinity параметрлері оңтайландырылды;
  • RoCE v2 негізіндегі RDMA арналары бапталды;
  • түйіндер арасындағы өзара әрекеттесу мен HPL параметрлері жетілдірілді;
  • ең жоғары өнімділікке қол жеткізу үшін GPU-параллелизм калибрленді.

Суперкомпьютердің қауіпсіздігі Zero-Trust қағидаттары негізінде қамтамасыз етілген:

  • SUSE NeuVector – контейнерлік ортаны қорғау, желілік саясаттар, рантаймды бақылау;
  • Palo Alto Networks – желіні сегментациялау, жаңа буындағы брандмауэр, периметр мен аймақаралық байланыстарды қорғау;
  • Thales – криптографиялық шешімдер, деректерді шифрлау және кілттерді қауіпсіз басқаруға арналған аппараттық модульдер.

Бұған дейін «Ұлттық ақпараттық технологиялар» АҚ техникалық мамандары халықаралық серіктестермен бірлесіп, HPL (Linpack) әдістемесі бойынша кешенді тестілеу жүргізді. Тестілеудің мақсаты – жүйенің өнімділігін өлшеу және оны TOP500 рейтингіне жіберуге дайындығын растау. Тестілеу нәтижелері суперкомпьютер қажетті көрсеткіштерге қол жеткізгенін дәлелдеді, бұл Қазақстанға жаһандық TOP500 рейтингіне ресми өтінім беруге мүмкіндік берді.