Вычислительный комплекс

Концепция построения реконфигурируемого вычислителя.

Наиболее перспективный подход при разработке компактных высокопроизводительных вычислительных комплексов основывается на концепции построения реконфигурируемых многопроцессорных вычислительных систем. Суть этой концепции заключается в том, что архитектура вычислительной системы должна иметь возможность адаптироваться под структуру решаемой задачи. Фактически это означает, что пользователю должна быть предоставлена возможность программировать проблемно-ориентированные многопроцессорные вычислительные системы, структура которых адекватна решаемой ими задаче. При этом достигается высокая реальная производительность вычислительной системы на широком классе задач, а также почти линейный рост производительности при увеличении числа процессоров.

В отличие от многопроцессорных вычислительных систем с «жесткой» архитектурой, в частности, кластерных суперЭВМ, архитектура реконфигурируемых систем может изменяться в процессе ее функционирования.

Область применения:

  • Организация высокоскоростной, эффективной локальной сети, обеспечивающей решение задач управления в реальном масштабе времени.
  • Построение эффективных контуров управления, работающих в реальном масштабе времени с любыми периферийными устройствами.
  • Создание достаточных вычислительных мощностей, специализированных на задаче.
  • Уменьшение массово габаритных характеристик устаревших вычислительных комплексов.

Отличительные особенности вычислительного комплекса:

  • Предусмотрена возможность расширения для увеличения вычислительных мощностей и подключения дополнительных периферийных устройств.
  • Вычислитель разработан для применения в различных системах и рассчитан на жесткие условия эксплуатации.
  • Высокая надежность работы, подтвержденная экспериментально, достигается благодаря применению современной элементной базы.
  • Применяются современные типы интерфейсов для достижения максимальной скорости обмена данными между функциональными элементами вычислителя.
  • Реализован уникальный подход к построению системы управления и мониторинга работоспособности всех узлов системы.
  • В основу вычислителя заложена современная, перспективная архитектура, представляющая собой сочетание аппаратных и программных решений.
  • В состав вычислителя могут входить различные типы универсальных вычислительных модулей (далее УВМ), каждый из которых специализируется на решении определённого круга задач.
  • Энергопотребление вычислителя от 50 до 500 Вт (зависит от решаемой задачи).

Состав вычислительного комплекса

Вычислительный комплекс состоит из совокупности УВМ и модулей периферийных устройств, объединенных между собой высокоскоростной коммуникационной сетью. В основе построения системы лежит принцип модульного наращивания. Наращивание вычислительной мощности осуществляется за счет добавления УВМ. Основными элементами УВМ являются кристаллы с большой степенью интеграции. Это программируемая логическая интегральная схема, ПЛИС с аппаратными процессорными ядрами PowerPC и Цифровые Сигнальные Процессоры (DSP).

Универсальный вычислительный модуль может содержать совокупность нескольких ПЛИС, объединённых в одно решающее поле. Применение ПЛИС обусловлено гибкостью их внутренней структуры. ПЛИС представляют собой некоторую матрицу логических ячеек, за счет программирования и коммутации которых можно создавать аппаратные реализации различных вычислительных структур, причем перепрограммирование логических ячеек и связей может осуществляться многократно. Иными словами, ПЛИС – это некоторый «полуфабрикат» микросхемы, внутреннюю структуру которой может определять сам пользователь. При разработке внутренней структуры ПЛИС удобно использовать готовые модули - так называемые IP-ядра. Эти модули обычно разрабатываются производителем ПЛИС, и их характеристики максимально оптимизированы. Ещё одним важным преимуществом ПЛИС является возможность реализации в них большого числа параллельных процессов. Это могут быть связанные и независимые процессы, такие как: математические операции, обработка команд, обслуживание внешних интерфейсов и пр. Можно задавать любые способы взаимодействия между этими процессами. Благодаря возможности распараллеливания, обработка векторных данных в ПЛИС занимает значительно меньшее время, чем в традиционных процессорных системах.

В состав УВМ включены ПЛИС последних поколений. Они содержат встроенные аппаратные процессорные ядра PowerPC и специализированные арифметические и DSP-блоки. Этот современный подход, называется «Система на кристалле». Активное применение процессорных ядер позволяет создавать мощные вычислительные системы, и при этом существенно сократить сроки проектирования за счёт использования уже отлаженных алгоритмов, написанных на традиционных языках программирования. Кроме того, процессорные ядра поддерживают возможность загрузки операционных систем реального времени. Операционная система может выполнять функции управления, мониторинга и решать ряд вычислительных задач. Вспомогательные функции операционной системы могут при необходимости использоваться любым модулем или узлом, размещённым непосредственно в ПЛИС. Многие операционные системы имеют стандартные механизмы взаимодействия с другими процессорными ядрами системы. Это позволяет организовывать микрокластерные структуры с расширяемой вычислительной средой.

Цифровые сигнальные процессоры могут также входить в состав УВМ. Они используются для цифровой обработки потоковых сигналов, а также для математической обработки оцифрованных аналоговых сигналов. Ключевой параметр цифрового процессора - это скорость. Она характеризует время обработки входного сигнала и, следовательно, определяет его максимальную частоту.

К преимуществам цифрового процессора относятся: быстрая конвейерная обработка потоковой информации, быстрое вычисление стандартных математических операций (например, преобразования Фурье для обработки радиолокационного сигнала, полученного от радара), ориентированность на работу с числами с плавающей точкой. Но в отличие от ПЛИС, процессор, в зависимости от выполняемой задачи, задействует только часть своих компонентов (регистров, АЛУ, схем ввода/вывода). При смене задачи задействуются другие компоненты и в другом составе, но всегда загруженность процессора будет составлять лишь часть от его потенциальных возможностей.

Важная характеристика любого модуля вычислителя – организация оперативной памяти, с которой работают вычислительные узлы. Оперативная память может быть: разделяемой для всех узлов; распределенной — доступной только для процессоров своего узла; распределенной разделяемой — доступной для процессоров своего узла и из других узлов.

Вычислительный комплекс:

Универсальный вычислительный модуль.

УВМ, имеет три варианта построения:

Аппаратный. (к оглавлению)

В состав аппаратного УВМ входят четыре микросхемы ПЛИС, реализующих алгоритм функционирования вычислителя с помощью системы аппаратных процессоров согласно общего графа состояния задачи. Система связей объединяет все ПЛИС на основе топологии каждый с каждым с помощью 50 каналов LVDS (максимальная скорость передачи по одному каналу LVDS – 1 Гигабит в секунду) и последовательного интерфейса RapidIO (максимальная скорость передачи 6.25 Гигабит в секунду). Каждая ПЛИС соединена с модулем памяти общим объемом 1Гб. Общая емкость памяти УВМ 4Гб. Каждая ПЛИС имеет отдельный канал Ethernet для обеспечения мониторинга и диагностики вычислительного процесса.

Все ПЛИС входящие в состав УВМ имеют выход на общий разъем PCI Express, который является внешним периферийным разъемом УВМ. Вычислительный ресурс представляет собой распределенную систему аппаратных процессоров, работа которых определена общим графом состояния системы. Реальный граф состояния системы строится на основе конкретного алгоритма функционирования устройства, с помощью специальных САПР. Для ПЛИС фирмы Altera такой САПР является QUARTUS, в составе которой находится инструмент построения графов состояния конечных автоматов. Это средство разработки позволяет строить состояния конечного автомата графическим и текстовым способом, вводить графы состояния центрального процессора и подграфы состояния связанных с центральным процессором устройств (блоков).

Аппаратно-программный. (к оглавлению)

УВМ имеющий аппаратно-программный вариант построения имеет аналогичную архитектуру, но вместо ПЛИС имеющих только аппаратные ресурсы, устанавливаются ПЛИС содержащие в своей архитектуре один или несколько встроенных аппаратных RISC процессоров и аппаратные вычислительные ресурсы. На основе операционной системы реального времени все аппаратные RISC процессоры объединяются в программный мини кластер. Используются стандартные средства разработки программного обеспечения.

Программный. (к оглавлению)

Архитектура программного УВМ, отличается тем, что вместо ПЛИС устанавливается DSP процессор. Программный УВМ целесообразно использовать в проектах использующих большой объем вычислений с плавающей точкой. Максимальная производительность одного модуля состоящего из четырех DSP процессоров 14.4 GFLOPS. DSP объединены между собой с помощью высокоскоростных последовательных каналов и составляют единый вычислительный ресурс, который представляет собой мини кластер под управлением операционной системы реального времени. DSP связаны с внешними УВМ и периферийными устройствами последовательным каналом PCI Express.

Возможен вариант комплексного использования УВМ.

Модуль периферийных устройств (к оглавлению).

Модуль периферийных устройств вычислителя предназначен для обеспечения ввода-вывода данных. В основу модуля заложен высокоскоростной последовательный интерфейс PCI Express. Преобразование PCI Express в другой вид интерфейса осуществляется с помощью специальных микросхем PCI Express мостов.

Кросс плата на основе PCI Express. PICMG EXP.0 R1.0 (к оглавлению).

Кросс плата представляет собой последовательный коммутатор структуры связей и предназначена для объединения всех модулей расположенных в вычислителе по спецификации PCI Express. PICMG EXP.0 R1.0 (специально разработана для жестких условий эксплуатации). Имеет в своем составе мост PCI Express-PCI для подключения стандартных периферийных модулей формата PCI PICMG 2.0. Топология объединения модулей задается с помощью PCI Express SWITCH.

Основные технические характеристики вычислительного комплекса.

Вычислительная среда
ПЛИС Virtex5 FXT, 16 шт.
Тактовая частота 550 MHz
Сигнальный процессор ADSP-TS201S, 4 шт.
Тактовая частота процессора 600 MHz
Скорость обмена внутри модуля До 800 Мб/с (HSTL и SSTL)
Память DDR2 2x512 Мбайт для каждой ПЛИС
2x512 Мбайт для каждого процессора
Память FLASH 8 МБайт для каждой ПЛИС
8 МБайт для каждого процессора
Подсистема ввода-вывода и управления
Шина PCI Express скорость передачи данных до 350 Мбайт/сек
Внешние интерфейсы: 4x (10/100/1000 Ethernet);
4х FibreChannel
МКИО (MKIO);
АРИНК (ARINK);
RS232;
RS485;
Общие характеристики
Напряжения питания От +7В до +36В,
Потребляемая мощность От 50 до 500 Вт
Конструктив модуля 6U, (PICMG EXP.0 R1.0)
Охлаждение воздушное принудительное
Масса модуля около 2 кг
Температурный диапазон - 50 ºС + 85 ºС
Акционерное общество Научно-Производственное Объединение «Развитие Инновационных Технологий»
г. Тверь, ул. Озёрная, 14 к.1, тел. +7 (4822) 32-20-01, +7 (4822) 45-25-09, факс +7 (4822) 32-23-00