Суперкомпьютеры


Суперкомпьютеры представляют собой огромный комплекс мощных компьютеров, состоящих из модулей памяти, процессоров, плат, объединённых в вычислительные узлы, связанные между собой в единую сеть.
Это супер-ЭВМ, которые используются для сложнейших вычислений на базе колоссального объёма данных за очень короткое время.
Рутинная работа человека над вычислениями, требующими многих месяцев и даже лет, выполняется суперкомпьютерами за секунды.
image.png
Суперкомпьютеры стоят очень дорого (от 100 до 500 млн долларов), так как требуют больших затрат времени и денежных средств на проектирование, монтаж, охлаждение, расходные материалы, энергию и обслуживание техники, поэтому строительство таких сложных систем могут позволить себе только наиболее развитые страны мира.
Работа этой сложнейшей системы требует подготовки по сбору данных и их вводу в систему, распределение заданий, контролю загрузки и выполнению задач.

Вычислительная способность суперкомпьютеров измеряется во флопсах – количестве операций с плавающей точкой, которые система может выполнять в секунду.
Один из первых суперкомпьютеров, созданный в 1975 году американский Cray-1, мог совершать 133 миллиона операций в секунду, соответственно, его пиковая мощность составляла 133 мегафлопс, а самый мощный на июнь 2019 года суперкомпьютер Summit Ок-Риджской национальной лаборатории обладает вычислительной мощностью 122,3 петафлопс, то есть 122,3 квадриллиона операций в секунду.
Вычисления такого порядка требуют соответствующей сложности задач и объёмов данных для работы.
Высокопроизводительные вычислительные системы Intel (HPC) позволяют достичь результатов в различных вариантах реальных рабочих нагрузок, — от моделирования и симуляции до визуализации и глубинного обучения — как локально, так и в облаке.

В июне 2021 года по числу систем в рейтинге страны распределяются так: Китай — 187 суперкомпьютеров (при этом из Топ-10 по мощности 2 суперкомпьютера установлены в Китае). США имеет в Топ-500 122 суперкомпьютера (при этом из Топ-10 по мощности 5 суперкомпьютеров установлено в США). Япония — 35 (при этом из Топ-10 только один суперкомпьютер, и одновременно самый мощный в мире суперкомпьютер Фугаку установлен в Японии). Германия — 23, Франция — 16, Голландия — 16, Ирландия — 14, Великобритания — 11, Канада — 11, Италия — 6, Бразилия — 6, Саудовская Аравия — 6, Южная Корея — 5, Польша — 4, Сингапур — 4, Россия — 3 (позиции 61, 199 и 240).
image.png
Согласно опубликованному рейтингу Top500 самых быстрых суперкомпьютеров за июнь 2021 года (в списке, обновляемом каждый год в июне и ноябре, начиная с 1993 года), рост производительности и совершенствование архитектуры суперкомпьютеров отслеживаются на основе бенчмарка High Performance Linpack (HPL), оценивающего, насколько хорошо компьютер решает системы линейных алгебраических уравнений.

Из первой десятки суперкомпьютеров, попавших в последний рейтинг, пять находятся в США, два в Китае и по одному в Японии, Германии и Италии.

Десять самых быстрых суперкомпьютеров рейтинга TOP500, июнь 2021 года
Номер 1: Fugaku
Суперкомпьютер Fugaku, построенный компанией Fujitsu, продолжает оставаться на первом месте в списке 500 самых быстрых суперкомпьютеров в мире, он по-прежнему в три раза быстрее ближайшего конкурента.
image.png
В гонке за производительность сохраняется напряженная ситуация. В первой десятке по сравнению с предыдущим рейтингом появился лишь один новичок – Perlmutter, установленный в Национальной лаборатории Лоуренса в Беркли, относящейся к министерству энергетики США. Он вошёл в список под номером пять, переместив всех, кто в ноябре 2020 года занимал места с пятого по девятое, на строчку ниже. Ну, а система Dammam-7 покинула первую десятку, пишут в Computerworld.

У системы Fugaku скорость оказалась той же, что и в ноябре 2020 года – 442 PFLOPS. Она построена компанией Fujitsu, имеет 7 630 848 ядер и находится в RIKEN Center for Computational Science (R-CCS) в японском городе Кобе.

Номер 2: Summit
Самая быстрая система в США обладает производительностью в 148,8 PFLOPS, той же самой, что и в ноябре прошлого года. У неё насчитывается 4356 процессорных узлов с двумя центральными процессорами Power9, каждый из которых состоит из 22 ядер, и шестью графическими процессорами Nvidia Tesla V100.
image.png
Каждый графический процессор оснащен 80 потоковыми мультипроцессорами. Связь между узлами поддерживается с помощью сети Mellanox dual-rail EDR InfiniBand. Система, построенная компанией IBM, развернута в Национальной лаборатории в Окридже министерства энергетики США.

Номер 3: Sierra
Система, архитектура которой очень похожа на архитектуру Summit, продемонстрировала производительность в 94,6 PFLOPS – такую же, что и в предыдущий раз.
image.png
Она состоит из 4320 узлов, объединяющих два центральных процессора Power9 и четыре графических процессора Nvidia Tesla V100, и установлена в Калифорнии, в Национальной лаборатории Лоуренса в Ливерморе.

Номер 4: Sunway TaihuLight
Эта система сохранила свое место с теми же показателями, что и в предыдущим рейтинге: 93 PFLOPS.
image.png
Sunway TaihuLight создана на базе процессоров Sunway SW26010 и имеет 10 649 600 ядер.
Она была разработана в китайском центре National Research Center of Parallel Computer Engineering & Technology (NRCPC) и развернута в Национальном суперкомпьютерном центре в Уси.

Номер 5: Perlmutter
Единственный новичок в первой десятке построен на платформе HPE Cray Shasta и гетерогенной системы с процессорами AMD EPYC и 1536 ускорителями Nvidia A100.
image.png
Его производительность составляет 64,4 PFLOPS.

Номер 6: Selene
Располагавшаяся в предыдущем рейтинге на пятой строчке система Nvidia DGX A100 SuperPOD построена на основе процессоров AMD EPYC, ускорителей Nvidia A100 и сети Mellanox HDR InfiniBand.
image.png
Её производительность оценивается в 63,4 PFLOPS и установлена она в центре Nvidia в США.

Номер 7: Tianhe-2A
В основе Tianhe-2A (Milky Way-2A) лежат центральные процессоры Intel Xeon и ускорители DSP NUDT Matrix-2000.
image.png
В системе насчитывается 4 981 760 ядер, что позволяет достигать производительности в 61,4 PFLOPS. Она была разработана китайским национальным университетом оборонных технологий (National University of Defense Technology, NUDT) и развернута в Национальном суперкомпьютерном центре в Гуанчжоу.

Номер 8: JUWELS Booster Module
Система BullSequana является самой мощной в Европе. Она построена на базе процессоров AMD EPYC, в качестве ускорителей используются Nvidia A100, а в качестве сети Mellanox HDR InfiniBand – та же архитектура, что и у системы Selene.
image.png
Созданная компанией Atos система развернута в Юлихском исследовательском центре (Forschungszentrum Juelich) в Германии.

Номер 9: HPC5
Система PowerEdge Dell при помощи ускорителей Nvidia Tesla V100 и сети Mellanox HDR InfiniBand достигает производительности в 35,5 PFLOPS.
image.png
Она была установлена итальянской компанией Eni.

Номер 10: Frontera
Благодаря 448448 ядрам Intel Platinum Xeon система Dell C6420, установленная в центре Texas Advanced Computing Center Техасского университета достигает производительности в 23,5 PFLOPS.
image.png
Суперкомпьютеры помогают решать сложнейшие задачи в сфере науки, инженерии и бизнеса — от индивидуальных методов лечения рака до прогнозирования климатических изменений и понимания химических процессов большого взрыва.
Решение этих сложных и ресурсоёмких задач требует больших вычислительных мощностей.

По данным на июнь 2021 года по числу систем в рейтинге лидирует Китай — 188 суперкомпьютеров (2 из них входят в Топ-10). США имеет в Top500 112 машин (при этом из Топ-10 5 суперкомпьютеров расположены в США). Япония — 34 (при этом в Топ-10 входит только один из них, но он является самым мощным в мире — Фугаку).
В России только 2 суперкомпьютера (в Сбербанке и МГУ).

По мере увеличения объёмов данных, а также с ростом потребности в скоростных вычислениях вычислительные системы переходят от суперкомпьютеров до компьютеров эксафлопсной производительности, таких как компьютер эксафлопсного класса Aurora, который ученые из Аргоннской национальной лаборатории планируют запустить в 2022 году.
Аргоннская, Ок-Риджская и Ливерморская национальная лаборатория делают системы доступными для промышленности и научно-образовательного сектора при условии наличия значительных интеллектуальных и экономических государственных инвестиций.
Команда Hyperion Research относит к суперкомпьютерам любую систему стоимостью более 500 тысяч долларов, которые содержат от сотен до тысяч узлов, таких как компьютерные рабочие станции, работающие параллельно.
У каждого узла есть много процессоров или ядер, которые выполняют команды. Компьютеры взаимодействуют через сеть для обеспечения синхронной работы.

В настоящее время самые быстрые суперкомпьютеры решают задачи с петафлопсной производительностью — 1015 вычислений в секунду (а точнее, операций с плавающей точкой в секунду), но с приходом эксафлопсных компьютеров вычисления станут в тысячу раз быстрее. К такому классу суперкомпьютеров относится Аврора.
image.png
Суперкомпьютер эксафлопсного класса делает за одну секунду миллиард миллиардов вычислений или квинтиллион, для тех, кто мыслит огромным числом нулей.

Исторически сложилось, что в круг проблем, которые решались с помощью суперкомпьютерных вычислений, входили моделирование и симуляция. Примеры включают изучение сталкивающихся галактик, субатомных свойств атомов или даже проектирование бутылочек с шампунем, которые не бьются, когда падают. Автомобильные производители использовали суперкомпьютерные вычисления, чтобы сократить длительность расчета срока службы машины с пяти до двух лет, сэкономив миллиарды долларов и годы работы за счет уменьшения количества необходимых попыток аэродинамического моделирования. Но суперкомпьютерные вычисления также затрагивают и новые вопросы и даже обнажают новые проблемы, требующие решения.
Техники искусственного интеллекта позволяют суперкомпьютерам делать логические выводы путем анализа всё более крупных массивов данных, но для этого требуется вычислительная мощность эксафлопсной производительности .
Учёные смогут задавать вопросы и получать ответы, которые ранее были невозможны.

Для работы самого быстрого в мире петафлопсного компьютера требуется 28,3 МВт, значит таким системам потребуется мощность от 30 до 50 МВт.

Мощности энергии в 50 МВт хватило бы на обеспечение электроэнергией жилых домов города с населением от 50 000 до 70000 человек.

Корпорация Intel в сотрудничестве с Аргоннской национальной лабораторией работает над созданием одного из первых в США суперкомпьютеров эксафлопсного класса. Суперкомпьютер Aurora позволит создать революционные решения в науке, в области инноваций и открытий для решения некоторых самых сложных глобальных задач.
Аврора — это трёхкомпонентная машина для одновременного выполнения моделирования и симуляции, управления искусственным интеллектом и машинным обучением, а также работы с большими данными и аналитикой.
Для этого потребуется огромный объём хранилищ с использованием высокопроизводительных систем коммутации. Aurora также будет использовать высокопроизводительный графический процессор общего назначения Ponte Vecchio на базе Xe, оптимизированный для рабочих нагрузок с использованием высокопроизводительных вычислений и искусственного интеллекта.


Comments 0