Петафлопс ума и сообразительности

На прошлой неделе в Объединенном институте ядерных исследований (ОИЯИ) официально ввели в эксплуатацию новый суперкомпьютер имени Н.Н. Говоруна, или, как указано в англоязычных брошюрах, просто . Новая вычислительная система состоит как из обычных процессоров Intel Xeon (разумеется, одних из лучших на сегодняшний день), так и из графических карт Nvidia Volta. Суммарная теоретическая пиковая мощность компьютера оценивается в один петафлопс, или один квадриллион операций с плавающей запятой в секунду. Мы побывали в Лаборатории информационных технологий (ЛИТ), где установлен «Говорун» и подготовили небольшую фотогалерею прямиком из машинного зала.

«Говорун» — гибридный, гетерогенный суперкомпьютер. Это значит, что он состоит из трех принципиально различных подсистем. Каждая из них, соответственно, состоит из нескольких мощных вычислительных узлов. Первая подсистема состоит из 21 узла с 72-ядерными процессорами Intel Xeon Phi 7290, которые прекрасно подходят для параллельных вычислений. Вторая подсистема построена на 18-ядерных процессорах Intel Xeon Gold 6154 — они хорошо справляются с ресурсоемкими вычислениями. На каждом из 40 узлов суперкомпьютера установлено по два таких процессора. Третья подсистема построена на графических ядрах (GPU). Она состоит из пяти узлов NVIDIA DGX-1 Volta, в каждом из них установлено по восемь видеокарт Tesla V100.


Интересно, что именно графическая часть вносит наибольший вклад в общую вычислительную мощность системы — более 600 терафлопс. Правда, стоит отметить, что разные виды чипов справляются лучше с разными видами задач. Объединение их в единое устройство — продолжение работ ЛИТ ОИЯИ над платформой HybriLIT для гетерогенных компьютеров.

Суперкомпьютеры, состоящие из огромного количества ядер, хорошо справляются с конкретными типами задач — теми, которые можно легко и эффективно распараллелить на большое количество вычислительных узлов. Это и понятно: если какая-то задача сводится к строго последовательному выполнению миллиардов простых действий, каждое из которых требует знания результата предыдущего, запускать ее больше чем на одном ядре бессмысленно. Другое дело, когда нам надо, например, взять и умножить матрицу на вектор или, проще, посчитать прогноз погоды из массива данных о скорости ветра, влажности и температуре на заданной карте. Тогда у нас возникает масса однотипных независимых действий, которые можно распределить на десятки ядер.

Какие задачи будет решать новый суперкомпьютер?

Здание Лаборатории информационных технологий ОИЯИ

Две подсистемы суперкомпьютера «Говорун» из трех построены на базе процессоров Intel Xeon и обеспечивают чуть меньше половины всей его вычислительной мощности

Система «РСК Торнадо». Каждый вычислительный узел состоит из двух процессоров Intel Xeon Gold или одного Intel Xeon Phi.


Нелюбовь кварков к одиночеству

Одна из нерешенных проблем современной физики элементарных частиц — проблема конфайнмента. Посмотрим на строение простейшего бариона — протона. Он состоит из трех кварков, удерживаемых вместе сильным взаимодействием. Попробуем оторвать один из кварков. Обычные взаимодействия быстро слабеют с расстоянием, но сильное взаимодействие, напротив, — растет, его даже сравнивают с натягиванием струны. После какого-то критического «усилия» кварк все же можно оторвать от протона, но энергии, которая выделится при разрыве «струны», хватит на то, чтобы образовать два новых кварка на ее концах. А значит, в результате мы вырвем из протона вместо одного кварка сразу пару (она называется мезон), да и сам протон останется при своих трех кварках.

Такое поведение подтверждается экспериментами на ускорителях элементарных частиц — при столкновениях протонов и тяжелых ядер разлетающиеся осколки представляют собой адроны, но никак не одиночные кварки. Одновременно с этим существует противоположное явление — деконфайнмент. При высоких температурах (гораздо выше триллионов градусов) энергия частиц оказывается настолько высокой, что они не удерживаются сильным взаимодействием и формируют плазму, в которой уже можно говорить об отдельных кварках. Современные модели утверждают, что спустя доли секунд после Большого Взрыва наша Вселенная существовала именно в виде кварк-глюонной плазмы. От того, при каких температурах и как именно происходит переход от конфайнмента к деконфайнменту, зависит наше понимание развития Вселенной.

Явления адронизации (рождения новых кварков после разрыва «струны») и конфайнмент чрезвычайно сложно описать теоретически — слишком громоздкими оказываются соответствующие уравнения квантовой хромодинамики. Однако есть хороший метод, который позволяет их решать численно, приближенно, — он называется решеточная квантовая хромодинамика (LQCD). Чтобы сделать численный расчет, непрерывное пространство-время превращают в четырехмерную сетку. Затем каждому узлу сетки ставят в соответствие состояние реальной системы в заданной точке пространства в заданный момент времени. В каждом узле сетки необходимо вычислить несколько интегралов, и они будут соответствовать путям, которыми может пойти исследуемый процесс. Для этого и необходим суперкомпьютер.

Кстати, исторически именно решение задач LQCD подтолкнуло развитие вычислительных систем — так, известная серия суперкомпьютеров Blue Gene «выросла» из систем QCDOC — «квантовой хромодинамики на чипах». Каждое ядро в таких чипах соответствовало узлу пространства-времени. Понятно, что чем больше узлов сетки мы можем взять (и чем больше ядер мы используем), тем точнее мы можем дать предсказания.

Инфраструктура системы охлаждения машинного зала ЛИТ ОИЯИ — фильтры и градирни

COM_SPPAGEBUILDER_NO_ITEMS_FOUND