PCI Express 3.0 — в два раза лучше прежнего стандарта


PDF версия

Скоро разработчики смогут воспользоваться преимуществами новой технологии PCI Express третьего поколения. Стандарт пока еще не утвержден, но уже известны его основные характеристики и отличия от существующих версий. Статья представляет собой сокращенный перевод работы [1].

С каждым новым поколением PCI Express полоса пропускания шины удваивается. Не исключение и стандарт PCI Express 3.0, который появится в скором будущем. Производительность шины будет увеличена до 8 Гбит/с на линии или 128 Гбит/с в режиме передачи по 16 каналам. Основные характеристики различных версий PCI Express приведены в таблице 1. Шина PCI Express 3.0 оптимизирована по ряду параметров и обеспечивает более высокую целостность сигнала. Кроме того, она полностью совместима с предыдущими версиями по стеку протоколов и может взаимодействовать с устройствами, поддерживающими только медленный режим обмена.

Таблица 1. Основные характеристики PCI Express

Стандарт

Скорость передачи сигнала, Гбит/с

Полезная скорость передачи (за вычетом добавочных битов), Гбит/с

Скорость передачи по
16 каналам, Гбит/с

PCI Express 1.0

2,5

2,0

32

PCI Express 2.0

5,0

4,0

64

PCI Express 3.0

8,0

8,0

128

Стандарт PCI Express 3.0 будет внедрен в первую очередь в графические приложения, системы связи и обработки видеосигнала, а также — в широкополосные системы распределения и устройства хранения RAID. Благодаря улучшению целостности сигнала и применению компенсационных схем шина может использоваться в соединительных и системных платах, что позволит снизить их стоимость, уменьшить потребление и одновременно улучшить характеристики.

Удвоение полосы пропускания

Полоса пропускания PCI Express 3.0 в два раза превышает пропускную способность PCI Express 2.0 не за счет увеличения скорости передачи. Для сравнения: скорость передачи в PCI Express 2.0 составляет 5 Гбит/с, а с учетом кодирования 8b/10b полезная скорость передачи равна 4 Гбит/с. Самый простой способ удвоить полосу пропускания — это увеличить скорость передачи до 10 Гбит/с, сохранив кодирование 8b/10b. Однако после тщательного анализа было выявлено, что целесообразно заменить избыточное кодирование на скремблирование — тогда количество добавочных битов уменьшается (128b/130b). Таким образом, с применением скремблирования требуемая скорость составляет не 10,
а 8 Гбит/с. За счет этого снижается мощность потребления, увеличивается целостность сигнала и, следовательно, снижается стоимость и увеличивается КПД системы.
Однако за все надо платить. При добавлении проверочных битов в каждый байт данных гарантируется отсутствие дрейфа постоянной составляющей. Это позволяет обеспечить связь физических сигналов по переменному току и облегчить процедуру восстановления данных, что в свою очередь позволяет упростить схему приемника.
Скремблирование — это маскирование данных с помощью известного полинома. При восстановлении данных применяется обратный полином. Недостаток этого подхода заключается в незащищенности от дрейфа постоянной составляющей. Следовательно, необходимо либо корректировать сигнал в приемнике, либо схема приемника должна быть устойчива к этому эффекту.
Второй недостаток проявляется на уровне протоколов. При использовании шифрования 8b/10b по добавочным битам всегда можно найти начало и конец пакета. При скремблировании это преимущество теряется, и в приемники и передатчики надо встраивать дополнительные элементы, например, счетчики длины пакетов. Тем не менее, даже такие недостатки с лихвой окупаются теми преимуществами, которые обеспечивает схема скремблирования: работа на физическом уровне идет на сниженной на 20% частоте, а пропускная способность системы передачи не меняется.

Новые возможности

Увеличенная вдвое полоса пропускания — не единственное нововведение в PCI Express 3.0. Сетевой уровень PCI Express претерпел два изменения: добавлены возможности взаимодействия в качестве управляющего устройства (host), чтобы ускорить работу, и средства для лучшего управления и уменьшения мощности потребления (оповещение о стойкости к задержке, динамическое распределение мощнос­ти и т.д.). Стоит заметить, что эти опции уже были реализованы в PCI Express 2.1, поскольку они не зависят от скорости работы. На физическом уровне улучшена целостность сигнала, особенно в случае прохождения длинных трасс или при наличии разрывов, обусловленных отверстиями на плате и другими явлениями.
Схема предварительного усиления позволяет преобразовывать энергию в передатчике в порции сигнала без изменения общей мощности потребления на физическом уровне. Для внесения предыскажений в канал применяется фильтр с конечной импульсной характеристикой (FIR — finite impulse response), чтобы снизить потери и согласовать канал. За счет этого увеличивается целостность сигнала.
В схему приемника включен блок коррекции с решающей обратной связью (DFE — Decision Feedback Equalizer). В отличие от других видов фильтров, которые усиливают шум, DFE только удаляет межсимвольную интерференцию и отражения. Этот тип фильтров особенно хорошо подходит для преодоления эффекта дискретных разрывов в канале, которые возникают, например, при резком изменении направления прохождения сигнала в отверстиях или слоях. Фильтр DFE имеет режим с пониженным расходом мощности. Приемник также имеет стационарную линейную схему коррекции (CTLE — continuous time linear equalizer), которая позволяет оптимизировать передачу по длинным каналам. Для компенсации изменений в параметрах аналоговой схемы и применения настроек эквалайзера используется автоматическая калибровка. В итоге в системе могут использоваться более длинные трассы на плате — это повышает гибкость разводки и надежность. Более того, в приемнике есть улучшенный блок детектирования, что позволяет предотвратить потерю сигнала из-за затухания или малой амплитуды сигнала в длинном канале связи.
В PCI Express 3.0 появились новые возможности отладки и тестирования: инжекция джиттера для повышения допустимого искажения сигнала и автоматическая генерация глазковой диаграммы. Таким образом, испытать целостность сигнала можно без использования дорогостоящего оборудования. При анализе глазковой диаграммы можно измерить не только ширину глаза, как в PCI Express 2.0, но и его высоту. По мере развития стандарта возможны и другие нововведения.

Применение в графических системах

Разрешение и сложность графических дисплеев продолжают расти. Соответственно, растет потребность в полосе пропускания соединителей для графических карт, а также требования к быстродействию графического процессора. Увеличив полосу в два раза по сравнению с 2.0, PCI Express 3.0 делает изображение более четким, а движение — более реалистичным. Функция multi-cast улучшает работу многопроцессорных систем. Как показано на рисунке 1, для рисования изображения на экране используются два графических процессора.

 

Рис. 1. Двуядерная схема вывода изображения на дисплей

Поскольку обработка изображения производится по заранее известному алгоритму, то центральный процессор может одновременно посылать команды в оба графических процессора, каждый из которых отвечает за свою область на экране. Как показано на рисунке 2, процессор GPU2 пересылает изображение в GPU1 через интерфейс передачи между равноправными устройствами, встроенный в коммутатор PCI Express 3.0. После этого ядро GPU1 выводит на экран обе части изображения. Такая организация обмена не только улучшает качество изображения, но и позволяет разгрузить основной процессор для выполнения других задач.
Технология PCI Express 3.0 будет также использоваться в приложениях с высоким быстродействием, таких как захват видеосигнала или широкополосное вещание. Для видеопроцессоров следующего поколения необходимы коммутаторы ввода/вывода, которые потребляют меньше энергии и обеспечивают большую полосу пропускания. Современные системы захвата видеосигнала работают на соединителях PCI и PCI Express 1.0, которые подсоединяют видеокодеки к ЦП. Если потребность в увеличении разрешения будет расти, ее пропускной способности уже не хватит.
Стандарт PCI Express 3.0 уже вот-вот появится, и, как и предыдущие версии PCI Express, в нем в два раза будет увеличена пропускная способность и улучшены другие характеристики. Таким образом, PCI Express станет еще более выгодным решением для обработки графики и других приложений, где требуются высокая скорость, малое потребление и сравнительно низкая стоимость.

Литература
1. PCI Express Gen 3: Twice as Nice and Then Some//RTC, август 2009 г.

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *