Новосибирский государственный университет

Факультет информационных технологий

Словарь терминов в коллекции "Вычислительные системы"

Классификация Шнайдера

Классификация Шнайдера: конкретизация класса SIMD, основанная на идее - выделения этапов выборки и непосредственно исполнения в потоках команд и данных.

В 1988 году Л.Шнайдер (L.Snyder) предложил новый подход к описанию архитектур параллельных вычислительных систем, попадающих в класс SIMD систематики Флинна. Основная идея заключается в выделении этапов выборки и непосредственно исполнения в потоках команд и данных. Именно разделение потоков на адреса и их содержимое позволяет описать такие ранее «неудобные» для классификации архитектуры, как компьютеры с длинным командным словом, систолические массивы и целый ряд других.

Потоком ссылок (reference stream) S некоторой ВС называется конечное множество бесконечных последовательностей пар:
S = {(a₁<t₁>)(a₂<t₂>)...,
(b₁<u₁>)(b₂<u₂>)...,
(c₁<v₁>)(c₂<v₂>)...},
где первый компонент каждой пары - это неотрицательное целое число, называемое адресом, второй компонент - это набор из n неотрицательных целых чисел, называемых значениями, причем n одинаково для всех наборов всех последовательностей. Например, пара (b₂<u₂>) определяет адрес b₂ и значение <u₂>. Если значения рассматривать как команды, то из потока ссылок получается поток команд I; если же значения интерпретировать как данные, то соответствующий поток - это поток данных D.

Интерпретация введенных понятий очень проста. Элементы каждой последовательности это адрес и его содержимое, выбираемое из (или записываемое в) память. Последовательность пар адрес-значение можно рассматривать как историю выполнения команд либо перемещения данных между процессором и памятью компьютера во время выполнения программы. Число инструкций, которое данный компьютер может выполнять одновременно, определяет число последовательностей в потоке команд. Аналогично, число различных данных, которое компьютер может обработать одновременно, определяет число последовательностей в потоке данных.

Пусть S произвольный поток ссылок. Последовательность адресов потока S, обозначаемая S_a, - это последовательность, чей i-й элемент - набор, сформированный из адресов i-х элементов каждой последовательности из S:
S_a = <a₁b₁...c₁>, <a₂b₂...c₂>,...
потока S, обозначаемая S_v, - это последовательность, чей i-й элемент - набор, образованный слиянием наборов значений i-х элементов каждой последовательности из S:
S_v = <t₁u₁...v₁>, <t₂u₂...v₂> ,...
Если S_x - последовательность элементов, где каждый элемент - набор из n чисел, то для обозначения «ширины» последовательности будем пользоваться обозначением: w(S_x) = n.
Из определений S_a, S_v и w сразу следует утверждение: если S - это поток ссылок со значениями из n чисел, то w(S_a) = |S| и w(S_v) = n|S|, где |S| обозначает мощность множества S.

Каждая пара (I, D) с потоком команд I и потоком данных D называется вычислительным шаблоном, а все компьютеры разбиваются на классы в зависимости от того, какой шаблон они могут исполнить. В самом деле, компьютер может исполнить шаблон (I, D), если он в состоянии:

выдать w(I_a) адресов команд для одновременной выборки из памяти;
декодировать и проинтерпретировать одновременно w(I_v) команд;
выдать одновременно w(D_a) адресов операндов и
выполнить одновременно w(D_v) операций над различными данными.

Если все эти условия выполнены, то компьютер может быть описан следующим образом: I_{w(I_a)w(I_v)}D_{w(D_a)w(D_v)}.

Классическая последовательная машина согласно классификации Флинна попадает в класс SISD, следовательно |I| = |D| = 1. Используя утверждение 1, получается, что w(I_a) = w(D_a) = 1. Из-за того, что в подобного рода компьютерах команды декодируются последовательно, следует равенство w(I_v) = 1, а последовательное исполнение команд дает w(D_v) = 1. Поэтому описание однопроцессорной машины с фон-неймановской архитектурой будет выглядеть так: I₁,₁D₁,₁.

Теперь рассмотрим две машины из класса SIMD: Goodyear Aerospace MPP и ILLIAC IV, причем не будем принимать во внимание разницу в способах обработки данных отдельными процессорными элементами. Единственный поток команд означает |I| = 1 для обеих машин. По тем же соображениям, использованным только что для последовательной машины, для потока команд получается равенство w(I_a) = w(I_v) = 1. Для доступа к операндам устройство управления (УУ) MPP рассылает один и тот же адрес всем процессорным элементам (ПЭ), поэтому в этой терминологии MPP имеет единственную последовательность в потоке данных, т.е. |D| = 1. Однако затем выборка данных из памяти и последующая обработка осуществляется в каждом ПЭ, поэтому w(D_v) = 16384, а вся система MPP может быть описана так: I₁,₁D₁,₁₆₃₈₄.

В ILLIAC IV УУ, так же, как и в MPP, рассылает один и тот же адрес всем ПЭ, однако каждый из них может получить свой уникальный адрес, добавляя содержимое локального индексного регистра. Это означает, что |D| = 64 и в системе присутствуют 64 потока адресов данных, определяющих одиночные потоки операндов, т.е. w(D_a) = w(D_v) = 64. Суммируя сказанное, описание ILLIAC IV выглядит так: I₁,₁D₆₄,₆₄.

Для более четкой классификации Шнайдер вводит три предиката для обозначения значений, которые могут принимать величины w(I_a), w(I_v), w(D_a) и w(D_v):

s - предикат «равен 1»;
с - предикат «от 1 до некоторой (небольшой) константы»;
m - предикат «от 1 до произвольно большого конечного числа».

В этих обозначениях, например, фон-неймановская машина принадлежит к классу I_ssD_ss. Несмотря на то, что и c и m в принципе не имеют определенной верхней границы, они отражают разные свойства архитектуры компьютера. c предполагает жесткие ограничения сверху со стороны аппаратуры, и соответствующий параметр не может быть значительно увеличен относительно простыми средствами. Примером может служить число инструкций, упакованных в командном слове VLIW компьютера. С другой стороны, описатель m используется тогда, когда обозначаемая величина может быть легко изменена, то есть другими словами, компьютер по данному параметру масштабируем. Например, относительная простота в увеличении числа ПЭ в системе MPP является основанием для того, чтобы отнести ее к классу I_ssD_sm. Конечно же, различие между c и m в достаточной мере условное и, как правило, порождает массу вопросов. В частности, как описать машину, в которой процессоры связаны через общую шину? С одной стороны, нет никаких принципиальных ограничений на число подключаемых процессоров. Однако каждый дополнительный процессор увеличивает загруженность шины, и при достижении некоторого порога подключение новых процессоров бессмысленно. Как описать такую систему, c или m? Автор оставляет данный вопрос открытым.

На основе указанных предикатов можно выделить следующие классы компьютеров:

I_ssD_ss - фон-неймановские машины;
I_ssD_sc - фон-неймановские машины, в которых заложена возможность выбирать данные, расположенные с разным смещением относительно одного и того же адреса, над которыми будет выполнена одна и та же операция. Примером могут служить компьютеры, имеющие команды, типа одновременного выполнения двух операций сложения над данными в формате полуслова, расположенными по указанному адресу;
I_ssD_sm - SIMD компьютеры без возможности получения уникального адреса для данных в каждом процессорном элементе, включающие MPP, Connection Machine 1 так же, как и систолические массивы;
I_ssD_cc - многомерные SIMD машины - фон-неймановские машины, способные расщеплять поток данных на независимые потоки операндов;
I_ssD_mm - это SIMD компьютеры, имеющие возможность независимой модификации адресов операндов в каждом ПЭ, например, ILLIAC IV и Connection Machine 2;
I_scD_cc - ВС, выбирающие и исполняющие одновременно несколько команд, для доступа к которым используется один адрес. Типичным примером являются компьютеры с длинным командным словом (VLIW);
I_ccD_cc - многомерные MIMD машины. Фон-неймановские машины, которые могут расщеплять свой цикл выборки/выполнения с целью обработки параллельно нескольких независимых команд;
I_mmD_mm - к этому классу относятся все компьютеры типа MIMD.

Достаточно ясно, что не нужно рассматривать все возможные комбинации описателей s, c и m, так как архитектура реальных компьютеров накладывает ряд вполне разумных ограничений. Очевидно, что число адресов w(S_a) не должно превышать числа возвращенных значений w(S_v), которое компьютер может обработать. Отсюда следуют неравенства: w(I_a) ≤ w(I_v) и w(D_a) ≤ w(D_v). Другим естественным предположением является тот факт, что число выполняемых команд не должно превышать числа обрабатываемых данных: w(I_v) ≤ w(D_v).

Подводя итог, можно отметить два положительных момента в классификации Шнайдера: более избирательная систематизация SIMD компьютеров и возможность описания нетрадиционных архитектур типа систолических массивов или компьютеров с длинным командным словом. Однако почти все ВС типа MIMD опять попали в один и тот же класс I_mmD_mm. Это и не удивительно, так как критерий классификации, основанный лишь на потоках команд и данных без учета распределенности памяти и топологии межпроцессорной связи, слишком слаб для подобных систем.

Литература

Snyder L. A Taxonomy of Synchronous Parallel Machines // Proceedings of the International Conference on Parallel Processing, ICPP '88, The Pennsylvania State University, University Park, PA, USA, August 1988, Volume 1. - P.281-285.

http://parallel.ru/computers/taxonomy

Воеводин Вл.В. Методы описания и классификации архитектур вычислительных систем / Вл.В. Воеводин, А.П. Капитонова. - М.:Издательство МГУ, 1994.

Литература

Дополнительная:

Воеводин Вл.В. Методы описания и классификации архитектур вычислительных систем / Вл.В. Воеводин, А.П. Капитонова. - М.:Издательство МГУ, 1994. - 79 с. - ISBN 5-211-03355-8.

Ключевые термины: архитектура вычислительной машины; процессор; уровни параллелизма; классификация флинна;

|Список основных тем курса|

Федотова Ольга

НГУ
ФИТ НГУ
ИВТ СО РАН

© 2012-2025, Новосибирский государственный университет, Новосибирск
© 2004-2025, Институт вычислительных технологий СО РАН, Новосибирск
© 2004-2025, Федотов А.М.
Дата последней модификации: 14.08.2013