Высокопроизводительный аппаратно-программный комплекс для реализации систем предиктивной аналитики больших данных

Презентация проекта
Архитектура обрабатывающего узла супер ЭВМ Тераграф
Структура гетерогенного узла
Микропроцессор Леонард Эйлер v4
РУКОВОДИТЕЛЬ: Попов Алексей Юрьевич, к.т.н., доцент, кафедра «Компьютерные системы и сети» (ИУ6)

О ПРОЕКТЕ: В МГТУ им. Н.Э.Баумана создан первый в мире высокопроизводительный вычислительный кластер, реализующий на аппаратном уровне операции дискретной математики DISC (Discrete Mathematics Instruction Set computer). Кластер предназначен для хранения и обработки графов сверх большой размерности до 1012 вершин, связанных ребрами.

АКТУАЛЬНОСТЬ: Чтобы и далее накапливать и анализировать информацию, человечеству необходимы новые подходы к структурированию знаний. Технологии представления и обработки знаний в виде графов уже стали прорывом для тех индустриальных решений, в которых другие методы показали низкую эффективность. Благодаря способности сохранять информацию о различных объектах и явлениях и учитывать связи между ними, графы знаний могут использоваться при анализе больших данных в био-информатике, в медицине, системах безопасности городов, в компьютерных сетях, финансовом секторе, при контроле сложного промышленного производства, для анализа информации социальных сетей и во многих других областях.
В основе технологии обработки графов лежит уникальный 24-ядерный микропроцессор Leonhard v4 (Леонард Эйлер), который  реализован и функционирует в ЦОД МГТУ им. Н.Э.Баумана.

АРХИТЕКТУРА гетерогенной супер ЭВМ: Анализ графов существенно отличается от привычной арифметико-логической обработки. Самыми существенными особенностями алгоритмов обработки графов являются:
- зависимости по данным между последовательными итерациями поиска и анализа информации
- большее количество операций доступа к памяти по сравнению с количеством арифметико-логических операций.
Поэтому была разработана специальная гетерогенная архитектура вычислительной системы Тераграф, учитывающая особенности обработки графов.

УЗЕЛ ОБРАБОТКИ ГРАФОВ: Один обрабатывающий узел вычислительной системы Тераграф содержит четыре блока энергонезависимой Оперативной памяти для хранения графов суммарного объема 30ТБ,  а также четырех взаимосвязанных модуля микропроцессоров Leonhard v4. Каждое ядро микропроцессора Leonhard v4 представляет собой так называемое гетерогенное ядро обработки графов (Graph Processing Core, GPC), содержащее специализированный микропроцессор обработки графов DISC Lnh64 и микропроцессор общего назначения RISCV 32IM. Конвейеры обоих процессоров  связаны специальным высокоскоростным интерфейсом. Такая архитектура позволяет двум процессорам взаимодействовать с минимальными задержками, что повышает производительность всего комплекса. Для каждого узла  GPN доступна ассоциативная кэш-память (Local Structure Memory) для хранения до 117 миллионов записей о вершинах и ребрах графов. Один GPN может одновременно хранить от 1 до 7 непересекающихся множеств вершин.

МИКРОПРОЦЕССОР Леонард Эйлер: Для эффективной и параллельной обработки информации вершин и ребер была разработана уникальная микроархитектура Леонард Эйлер, не имеющая аналогов в мире. В составе микропроцессора впервые реализованы устройства для выполнения всех основных операций дискретной математики над множествами, включая такие операции как: поиск, вставка, удаление, минимум/максимум, следующий/предыдущий, И-ИЛИ-НЕ операции, а также операции срезов (LS,LSEQ,GR,GREQ и GRLS. Уникальные блоки в составе микропроцессора представляют собой устройства с микроархитектурой SIMD: Каталог и Операционный буфер. Машинные инструкции NSM и NGR позволяют выполнить поиск ближайшего элемента множества при интерполяции данных, что существенно ускоряет алгоритмы машинного обучения (Maсhine Learning).

ИЗОБРАЖЕНИЯ:

ПРИОРИТЕТ 2030^

На главную
Автор сайта: Dmitry Vidmanov, vidmanov@bmstu.ru