Высокопроизводительные вычислительные комплексы (ВВК)

ВВК объединяют в себе:

  • бортовые вычислительные комплексы;
  • стационарные аппаратные вычислительные комплексы;
  • аппаратные ускорители вычислительного процесса, интегрированные в архитектуру кластерных вычислительных комплексов.

Концепция построения ВВК

Наиболее перспективный подход при разработке компактных высокопроизводительных вычислительных комплексов основывается на концепции построения реконфигурируемых многопроцессорных вычислительных систем. Суть этой концепции заключается в том, что архитектура вычислительной системы должна иметь возможность адаптироваться под структуру решаемой задачи. Фактически это означает, что пользователю должна быть предоставлена возможность программировать проблемно-ориентированные многопроцессорные вычислительные системы, структура которых адекватна решаемой ими задаче. При этом достигается высокая реальная производительность вычислительной системы на широком классе задач, а также почти линейный рост производительности при увеличении числа процессоров.

В отличие от многопроцессорных вычислительных систем с «жесткой» архитектурой, в частности, кластерных суперЭВМ, архитектура реконфигурируемых систем может изменяться в процессе ее функционирования.

Область применения

  • Построение эффективных контуров управления, работающих в реальном масштабе времени с любыми периферийными устройствами.
  • Создание достаточных вычислительных мощностей, специализированных на задаче.
  • Организация высокоскоростной, эффективной локальной сети, обеспечивающей решение задач управления в реальном масштабе времени.
  • Предварительная обработка потока видеоинформации, с оптических и радиолокационных средств.
  • Распознание образов, идентификация цели.
  • Автономное управление специальными средствами.
  • Уменьшение массово габаритных характеристик устаревших вычислительных комплексов.

Отличительные особенности вычислительного комплекса

  • Предусмотрена возможность расширения для увеличения вычислительных мощностей и подключения дополнительных периферийных устройств.
  • Вычислитель разработан для применения в различных системах и рассчитан на жесткие условия эксплуатации.
  • Высокая надежность работы, подтвержденная экспериментально, достигается благодаря применению современной элементной базы.
  • Применяются современные типы интерфейсов для достижения максимальной скорости обмена данными между функциональными элементами вычислителя.
  • Реализован уникальный подход к построению системы управления и мониторинга работоспособности всех узлов системы.
  • В основу вычислителя заложена современная, перспективная архитектура, представляющая собой сочетание аппаратных и программных решений.
  • В состав вычислителя могут входить различные типы универсальных вычислительных модулей (далее УВМ), каждый из которых специализируется на решении определённого круга задач.

Энергопотребление вычислителя от 50 до 500 Вт (зависит от решаемой задачи).

Состав вычислительного комплекса

Вычислительный комплекс состоит из совокупности УВМ и модулей периферийных устройств, объединенных между собой высокоскоростной коммуникационной сетью. В основе построения системы лежит принцип модульного наращивания. Наращивание вычислительной мощности осуществляется за счет добавления УВМ. Основными элементами УВМ являются кристаллы с большой степенью интеграции. Это Программируемая логическая интегральная схема, ПЛИС с аппаратными процессорными ядрами PowerPC и Цифровые Сигнальные Процессоры (DSP).

В состав УВМ включены ПЛИС последних поколений. Они содержат встроенные аппаратные процессорные ядра PowerPC и специализированные арифметические и DSP-блоки. Процессорные ядра поддерживают возможность загрузки операционных систем реального времени. Операционная система может выполнять функции управления, мониторинга и решать ряд вычислительных задач. Многие операционные системы имеют стандартные механизмы взаимодействия с другими процессорными ядрами системы. Это позволяет организовывать микрокластерные структуры с расширяемой вычислительной средой.

Цифровые сигнальные процессоры DSP-блоки используются для цифровой обработки потоковых сигналов, а также для математической обработки оцифрованных аналоговых сигналов. Ключевой параметр цифрового процессора - это скорость. Она характеризует время обработки входного сигнала и, следовательно, определяет его максимальную частоту.

Важная характеристика любого модуля вычислителя – организация оперативной памяти, с которой работают вычислительные узлы. Оперативная память может быть: разделяемой для всех узлов; распределенной — доступной только для процессоров своего узла; распределенной разделяемой — доступной для процессоров своего узла и из других узлов.

Универсальный вычислительный модуль

УВМ имеет три варианта построения:

  • Аппаратный
  • Аппаратно – программный
  • Программный

Аппаратный.

В состав аппаратного УВМ входят четыре микросхемы ПЛИС, реализующих алгоритм функционирования вычислителя с помощью системы аппаратных процессоров согласно общего графа состояния задачи. Система связей объединяет все ПЛИС на основе топологии каждый с каждым с помощью 50 каналов LVDS (максимальная скорость передачи по одному каналу LVDS – 1 Гигабит в секунду) и последовательного интерфейса RapidIO (максимальная скорость передачи 6.25 Гигабит в секунду). Каждая ПЛИС соединена с модулем памяти общим объемом 1Гб. Общая емкость памяти УВМ 4Гб. Каждая ПЛИС имеет отдельный канал Ethernet для обеспечения мониторинга и диагностики вычислительного процесса.

Все ПЛИС входящие в состав УВМ имеют выход на общий разъем PCI Express, который является внешним периферийным разъемом УВМ. Вычислительный ресурс представляет собой распределенную систему аппаратных процессоров, работа которых определена общим графом состояния системы.

Аппаратно-программный

УВМ имеющий аппаратно-программный вариант построения имеет аналогичную архитектуру, но вместо ПЛИС имеющих только аппаратные ресурсы, устанавливаются ПЛИС содержащие в своей архитектуре один или несколько встроенных аппаратных RISC процессоров и аппаратные вычислительные ресурсы. На основе операционной системы реального времени все аппаратные RISC процессоры объединяются в программный мини кластер. Используются стандартные средства разработки программного обеспечения.

Программный.

Архитектура программного УВМ, отличается тем, что вместо ПЛИС устанавливается DSP процессор. Программный УВМ целесообразно использовать в проектах, использующих большой объем вычислений с плавающей точкой. Максимальная производительность одного модуля, состоящего из четырех DSP процессоров 14.4 GFLOPS. DSP объединены между собой с помощью высокоскоростных последовательных каналов и составляют единый вычислительный ресурс, который представляет собой мини кластер под управлением операционной системы реального времени. DSP связаны с внешними УВМ и периферийными устройствами последовательным каналом PCI Express.

Возможен вариант комплексного использования УВМ.

Модуль периферийных устройств

Модуль периферийных устройств вычислителя предназначен для обеспечения ввода-вывода данных. В основу модуля заложен высокоскоростной последовательный интерфейс PCI Express. Преобразование PCI Express в другой вид интерфейса осуществляется с помощью специальных микросхем PCI Express мостов.

Кросс плата на основе PCI Express. PICMG EXP.0 R1.0.

Кросс плата представляет собой последовательный коммутатор структуры связей и предназначена для объединения всех модулей, расположенных в вычислителе по спецификации PCI Express. PICMG EXP.0 R1.0 (специально разработана для жестких условий эксплуатации). Имеет в своем составе мост PCI Express-PCI для подключения стандартных периферийных модулей формата PCI PICMG 2.0. Топология объединения модулей задается с помощью PCI Express SWITCH.

Основные технические характеристики вычислительного комплекса

ПараметрЗначение
Вычислительная среда
ПЛИСVirtex5 FXT, 16 шт.
Тактовая частота ПЛИС550 MHz
Сигнальный процессорADSP-TS201S, 4 шт.
Тактовая частота процессора600 MHz
Скорость обмена внутри модуляДо 800 Мб/с (HSTL и SSTL)
Память DDR2

2x512 Мбайт для каждой ПЛИС

2x512 Мбайт для каждого процессора

Память FLASH

8 МБайт для каждой ПЛИС

8 МБайт для каждого процессора

Подсистема ввода-вывода и управления
Шина PCI Express

скорость передачи данных

до 350 Мбайт/сек

Внешние интерфейсы:

4 x (10/100/1000 Ethernet);

4 х FibreChannel

МКИО (MKIO);

АРИНК (ARINK);

RS232;

RS485;

Общие характеристики
Напряжения питанияОт +7В до +36В,
Потребляемая мощностьОт 50 до 500 Вт
Конструктив модуля6U, (PICMG EXP.0 R1.0)
Охлаждениевоздушное принудительное
Масса модуляоколо 2 кг
Температурный диапазон- 50 ºС + 85 ºС

Аппаратно-программный ускоритель математических вычислений (АПУ-МВ)

Назначение

АПУ-МВ предназначен для реализации алгоритмов ЦОС (цифровой обработки сигналов) в задачах, требующих больших вычислительных ресурсов, и повышения производительности существующих вычислительных систем при решении математических задач, требующих большого объема вычислений.

Особенности построения

В основу АПУ-МВ положена модульная конструкция на основе высокоскоростной коммутационной сети с топологией «Куб/3D‑тор», позволяющей объединять вычислительные ячейки и масштабировать вычислительный ресурс. Вычислительная ячейка является узлом коммутационной сети. Каждая ячейка строится на аппаратном подходе на базе программируемых логических схем (ПЛИС), обладающих высокой пиковой вычислительной и коммутационной производительностью.

Вычислительные ячейки выполнены в форм-факторе 6U (евромеханика) и объединяются с помощью кроссплаты в вычислительный блок. Увеличение производительности производится добавлением вычислительных блоков в стойку. Конструкция ячеек выполнена в соответствии со стандартом VITA 46.0.

Вычислительные ячейки могут быть следующих типов:

- аппаратные (построены на кристаллах ПЛИС)
- аппаратно-программные (построены на кристаллах ПЛИС и процессорах)

Преимущества (функциональные возможности)

Применение АПУ-МВ для решения математических задач, структура которых позволяет обеспечить высокий уровень распараллеливания задач и формирования вычислительного конвейера значительно сокращает время решения задачи.

Модульная конструкция позволяет использовать ячейки различных типов с функционалом, наиболее подходящим для решения поставленной задачи.

Связь по оптическому каналу между блоками.
Сервисная сеть для загрузки, мониторинга, диагностики, отладки.

Технические характеристики

ПараметрЗначение
Производительность ячейки из четырех кристаллов ПЛИС, GMAC/s11380
Суммарная физическая скорость каналов связи, Гбит/с800
Частота работы внутренних модулей ПЛИС, МГц600
Объем оперативной памяти ГБайт4
Портов Gigabit Ethernet, шт8
Потребляемая мощность, Вт (не более)150
Структурная схема вычислительной ячейки
Внешний вид вычислительной ячейки (размер 6U)
Схема соединения ячеек в блоке
Топология связей «Куб/3D-тор»
Вычислительный блок
Вычислительная стойка