Скоро разработчики смогут воспользоваться преимуществами новой технологии PCI Express третьего поколения. Стандарт пока еще не утвержден, но уже известны его основные характеристики и отличия от существующих версий. Статья представляет собой сокращенный перевод работы [1].
С каждым новым поколением PCI Express полоса пропускания шины удваивается. Не исключение и стандарт PCI Express 3.0, который появится в скором будущем. Производительность шины будет увеличена до 8 Гбит/с на линии или 128 Гбит/с в режиме передачи по 16 каналам. Основные характеристики различных версий PCI Express приведены в таблице 1. Шина PCI Express 3.0 оптимизирована по ряду параметров и обеспечивает более высокую целостность сигнала. Кроме того, она полностью совместима с предыдущими версиями по стеку протоколов и может взаимодействовать с устройствами, поддерживающими только медленный режим обмена.
Стандарт |
Скорость передачи сигнала, Гбит/с |
Полезная скорость передачи (за вычетом добавочных битов), Гбит/с |
Скорость передачи по |
PCI Express 1.0 |
2,5 |
2,0 |
32 |
PCI Express 2.0 |
5,0 |
4,0 |
64 |
PCI Express 3.0 |
8,0 |
8,0 |
128 |
Стандарт PCI Express 3.0 будет внедрен в первую очередь в графические приложения, системы связи и обработки видеосигнала, а также — в широкополосные системы распределения и устройства хранения RAID. Благодаря улучшению целостности сигнала и применению компенсационных схем шина может использоваться в соединительных и системных платах, что позволит снизить их стоимость, уменьшить потребление и одновременно улучшить характеристики.
Полоса пропускания PCI Express 3.0 в два раза превышает пропускную способность PCI Express 2.0 не за счет увеличения скорости передачи. Для сравнения: скорость передачи в PCI Express 2.0 составляет 5 Гбит/с, а с учетом кодирования 8b/10b полезная скорость передачи равна 4 Гбит/с. Самый простой способ удвоить полосу пропускания — это увеличить скорость передачи до 10 Гбит/с, сохранив кодирование 8b/10b. Однако после тщательного анализа было выявлено, что целесообразно заменить избыточное кодирование на скремблирование — тогда количество добавочных битов уменьшается (128b/130b). Таким образом, с применением скремблирования требуемая скорость составляет не 10,
а 8 Гбит/с. За счет этого снижается мощность потребления, увеличивается целостность сигнала и, следовательно, снижается стоимость и увеличивается КПД системы.
Однако за все надо платить. При добавлении проверочных битов в каждый байт данных гарантируется отсутствие дрейфа постоянной составляющей. Это позволяет обеспечить связь физических сигналов по переменному току и облегчить процедуру восстановления данных, что в свою очередь позволяет упростить схему приемника.
Скремблирование — это маскирование данных с помощью известного полинома. При восстановлении данных применяется обратный полином. Недостаток этого подхода заключается в незащищенности от дрейфа постоянной составляющей. Следовательно, необходимо либо корректировать сигнал в приемнике, либо схема приемника должна быть устойчива к этому эффекту.
Второй недостаток проявляется на уровне протоколов. При использовании шифрования 8b/10b по добавочным битам всегда можно найти начало и конец пакета. При скремблировании это преимущество теряется, и в приемники и передатчики надо встраивать дополнительные элементы, например, счетчики длины пакетов. Тем не менее, даже такие недостатки с лихвой окупаются теми преимуществами, которые обеспечивает схема скремблирования: работа на физическом уровне идет на сниженной на 20% частоте, а пропускная способность системы передачи не меняется.
Увеличенная вдвое полоса пропускания — не единственное нововведение в PCI Express 3.0. Сетевой уровень PCI Express претерпел два изменения: добавлены возможности взаимодействия в качестве управляющего устройства (host), чтобы ускорить работу, и средства для лучшего управления и уменьшения мощности потребления (оповещение о стойкости к задержке, динамическое распределение мощности и т.д.). Стоит заметить, что эти опции уже были реализованы в PCI Express 2.1, поскольку они не зависят от скорости работы. На физическом уровне улучшена целостность сигнала, особенно в случае прохождения длинных трасс или при наличии разрывов, обусловленных отверстиями на плате и другими явлениями.
Схема предварительного усиления позволяет преобразовывать энергию в передатчике в порции сигнала без изменения общей мощности потребления на физическом уровне. Для внесения предыскажений в канал применяется фильтр с конечной импульсной характеристикой (FIR — finite impulse response), чтобы снизить потери и согласовать канал. За счет этого увеличивается целостность сигнала.
В схему приемника включен блок коррекции с решающей обратной связью (DFE — Decision Feedback Equalizer). В отличие от других видов фильтров, которые усиливают шум, DFE только удаляет межсимвольную интерференцию и отражения. Этот тип фильтров особенно хорошо подходит для преодоления эффекта дискретных разрывов в канале, которые возникают, например, при резком изменении направления прохождения сигнала в отверстиях или слоях. Фильтр DFE имеет режим с пониженным расходом мощности. Приемник также имеет стационарную линейную схему коррекции (CTLE — continuous time linear equalizer), которая позволяет оптимизировать передачу по длинным каналам. Для компенсации изменений в параметрах аналоговой схемы и применения настроек эквалайзера используется автоматическая калибровка. В итоге в системе могут использоваться более длинные трассы на плате — это повышает гибкость разводки и надежность. Более того, в приемнике есть улучшенный блок детектирования, что позволяет предотвратить потерю сигнала из-за затухания или малой амплитуды сигнала в длинном канале связи.
В PCI Express 3.0 появились новые возможности отладки и тестирования: инжекция джиттера для повышения допустимого искажения сигнала и автоматическая генерация глазковой диаграммы. Таким образом, испытать целостность сигнала можно без использования дорогостоящего оборудования. При анализе глазковой диаграммы можно измерить не только ширину глаза, как в PCI Express 2.0, но и его высоту. По мере развития стандарта возможны и другие нововведения.
Разрешение и сложность графических дисплеев продолжают расти. Соответственно, растет потребность в полосе пропускания соединителей для графических карт, а также требования к быстродействию графического процессора. Увеличив полосу в два раза по сравнению с 2.0, PCI Express 3.0 делает изображение более четким, а движение — более реалистичным. Функция multi-cast улучшает работу многопроцессорных систем. Как показано на рисунке 1, для рисования изображения на экране используются два графических процессора.
Рис. 1. Двуядерная схема вывода изображения на дисплей
|
Поскольку обработка изображения производится по заранее известному алгоритму, то центральный процессор может одновременно посылать команды в оба графических процессора, каждый из которых отвечает за свою область на экране. Как показано на рисунке 2, процессор GPU2 пересылает изображение в GPU1 через интерфейс передачи между равноправными устройствами, встроенный в коммутатор PCI Express 3.0. После этого ядро GPU1 выводит на экран обе части изображения. Такая организация обмена не только улучшает качество изображения, но и позволяет разгрузить основной процессор для выполнения других задач.
Технология PCI Express 3.0 будет также использоваться в приложениях с высоким быстродействием, таких как захват видеосигнала или широкополосное вещание. Для видеопроцессоров следующего поколения необходимы коммутаторы ввода/вывода, которые потребляют меньше энергии и обеспечивают большую полосу пропускания. Современные системы захвата видеосигнала работают на соединителях PCI и PCI Express 1.0, которые подсоединяют видеокодеки к ЦП. Если потребность в увеличении разрешения будет расти, ее пропускной способности уже не хватит.
Стандарт PCI Express 3.0 уже вот-вот появится, и, как и предыдущие версии PCI Express, в нем в два раза будет увеличена пропускная способность и улучшены другие характеристики. Таким образом, PCI Express станет еще более выгодным решением для обработки графики и других приложений, где требуются высокая скорость, малое потребление и сравнительно низкая стоимость.