OMAP35хх: возможности и особенности


PDF версия

В статье рассмотрены возможности и некоторые отличительные особенности мультимедийных процессоров семейства OMAP35xx.

Введение

Расширение рынка мультимедийных устройств массового применения стимулирует производство высокоскоростных программируемых процессоров для встраиваемых систем. Следуя тенденциям развития рынка потребительской электроники, разработчики ведущих компаний (Analog Devices, Freescale Semiconductor, Intel, Marvell, Philips, Texas Instruments и др.) в последние годы приложили немало усилий для создания и выпуска новых модификаций программируемых мультимедийных процессоров [1—7].

Возможности

Процессоры, предназначенные для использования во встраиваемых мультимедийных приложениях (PDA, медиаплеерах, цифровых фото- и видеокамерах и т.д.), должны совмещать не только возможность высокоскоростной цифровой обработки видео- и аудиосигналов, но и должны быть ориентированы на решение задач управления/контроля. Кроме того, для мультимедийных устройств разного назначения характерно наличие большого объема встроенной памяти типа DDR SDRAM, Mobile DDR; флэш; высококачественного цветного ЖК-дисплея для отображения информации; источников аудио- и видеосигналов; клавиатуры; стандартных интерфейсов, с помощью которых поддерживается обмен данными с внешними устройствами (компьютерами, фото- или видеокамерами, принтерами, PDA, GSM-/GPRS-модемами, устройствами беспроводного доступа типа Wi-Fi и т.д.). Немаловажным является также возможность хранения большого объема информации во встроенной памяти типа NAND-флэш или сменных флэш-картах, что обусловливает необходимость встраивания в процессоры периферийных контроллеров стандартных интерфейсов: MMC/SD/SDIO/microSD и т.д. Для эффективного обмена данными в процессорах должны быть реализованы высокоскоростные интерфейсы: USB 2.0, USB OTG (On-the-Go), Ethernet и т.д.

Компания Texas Instruments предлагает ряд мультимедийных процессоров для мобильных приложений семейства OMAP. Приведенная на рисунке 1 архитектура OMAP3530 наглядно иллюстрирует широкие возможности мультимедийных процессоров семейства OMAP35xx.

Рис. 1. Архитектура OMAP3530

Главное отличие процессоров, предназначенных для использования во встраиваемых мультимедийных устройствах массового применения, — сохранение высокой производительности при минимальном уровне энергопотребления. Кроме того, эти процессоры должны отличаться низкой стоимостью и миниатюрным корпусом.

Процессоры OMAP35xx ориентированы на использование в портативных устройствах, поддерживающих беспроводные технологии. Они отличаются высокой производительностью и наличием большого набора встроенных периферийных контроллеров для связи с «внешним миром» (см. рис. 1). Архитектура процессоров OMAP35xх базируется на высокопроизводительном ARM-ядре Cortex-A8. В самых мощных процессорах OMAP3530/25 содержится процессорное ядро ARM Cortex-8A с максимальной тактовой частотой 720 МГц и SIMD-сопроцессор NEON, аудиовидеопроцессор IVA 2.2 (Imaging Video and Audio Processor) с аппаратным видеоускорителем на базе ядра C64x+ (с тактовой частотой до 530 МГц), а также 3D-графический ускоритель PowerVR SGX (только в OMAP3530).

Особенности

Миниатюризация гаджетов, а также необходимость снижения энергопотребления портативных устройств при одновременном расширении их функциональности, в т.ч. мультимедийных возможностей, стимулируют усовершенствование технологии изготовления интегральных микросхем и поиск новых путей уменьшения габаритных размеров и снижения уровня энергопотребления.

Один из самых простых способов миниатюризации — уменьшение размеров кристалла и шага сферических выводов. Процессоры семейства OMAP35хх, впрочем, как и процессоры других производителей (например, Analog Devices, Freescale Semiconductor, Intel, Marvell, Philips и др.), отличаются малогабаритным корпусом. Процессоры OMAP35хх изготавливаются по технологии 65 нм и выпускаются в корпусах размерами 12×12, 14×14 мм (с шагом сферических выводов 0,4/0,5 мм) или 16×16 мм (с шагом 0,65 мм).

Второй способ миниатюризации заключается в расположении микросхем друг над другом. По этой технологии, как правило, монтируются микросхемы в корпусах BGA. Наиболее часто этот способ используется для монтажа микросхем памяти, т.к., во-первых, они имеют регулярную структуру, а, во-вторых, это позволяет уменьшить до минимума время распространения сигналов (за счет сокращения длины проводников) и, следовательно, увеличить скорость передачи данных. Отличительной особенностью процессоров семейства OMAP35хх является также поддержка технологии монтажа на поверхность корпуса микросхемы (Package on Package — PoP). На рисунке 2 приведен внешний вид процессора и ИС памяти, установленной на корпусе процессора, на рисунке 3 — вариант трассировки проводников.

Рис. 2. Внешний вид процессора OMAP и ИС памяти

Рис. 3. Вариант трассировки проводников

Рассеиваемая мощность ИС, изготовленной по КМОП-технологии, определяется двумя основными составляющими: динамической и статической. Динамическая составляющая (Pдинам ~nCFV2) пропорциональна числу переключаемых вентилей (n), эквивалентной емкости нагрузки (С), частоте переключения вентилей (F) и связана квадратичной зависимостью с напряжением питания (V), и, в основном, обусловлена двумя составляющими, возникающими из-за протекания сквозных токов через логические вентили и перезаряда паразитных емкостей, в т.ч. емкости нагрузки. Вклад сквозных токов в динамическую составляющую учитывается в эквивалентной емкости нагрузки. Мощность потребления стандартного базового инвертора в статическом режиме, т.е. при условии, что отсутствуют переключения транзисторов и один из них «закрыт», с достаточно большой точностью определяется выражением: Pстат.=kVIутечки, где k — коэффициент; V — напряжение питания; Iутечки — суммарный ток утечки, имеющий три основные составляющие. При подсчете суммарной статической мощности потребления также следует учитывать число транзисторов на кристалле. Например, процессор OMAP3530 содержит примерно 150 млн транзисторов. Ток утечки транзисторов, изготовленных по субмикронной технологии, имеет нелинейную зависимость от размеров канала P- или N-транзистора, а, кроме того, ток утечки зависит от многих других факторов, в т.ч. от напряжения питания, напряжения порога запирания и отпирания, типа диэлектрика, используемого в технологическом процессе и т.д.

Бурный рост производительности процессоров обусловлен, главным образом, уменьшением размеров транзисторов, что позволяет увеличить и их быстродействие, и их количество на кристалле. Вместе с тем, при уменьшении топологических норм транзисторов до 32–45 нм, а в ближайшее время — и до 22 нм (уже в 2010 г.), проектировщики и технологи сталкиваются со многими проблемами, которые являются в некоторой степени сдерживающими факторами развития полупроводниковой индустрии. Не говоря о многих существующих технологических проблемах, остановимся только на тех, которые связаны с потребляемой и рассеиваемой мощностью. При уменьшении топологических норм до 65/45/32/22 нм стремительно (по экспоненциальному закону) возрастает ток утечки, т.к. вместе с линейными размерами уменьшается не только длина канала, но и толщина диэлектрика между кремниевой подложкой и затвором, в качестве которого до последнего времени использовали, главным образом, диоксид кремния (SiO2). В современных микросхемах, изготовленных по технологии 65 нм, толщина диэлектрика составляет всего 1—2 нм, что составляет примерно 5—6 атомарных слоев. Еще сравнительно недавно, в те времена, когда доминировала 250- или 180-нм КМОП-технология, львиная доля потребляемой мощности приходилась на динамическую составляющую, вклад же в потребляемую ИС мощность за счет токов утечки был мизерным, и ее, как правило, не принимали во внимание. В настоящее время ситуация резко изменилась, и в связи с ростом тока утечки его вклад в суммарную потребляемую мощность стал составлять до 70% (см. рис. 4) [4].

Рис. 4. Вклад статической потребляемой мощности в ее суммарную величину в зависимости от технологии изготовления

Пока гиганты полупроводниковой индустрии экспериментируют с усовершенствованными технологиями и ищут новые материалы (в т.ч. для замены диоксида кремния) с целью увеличения эффективности работы транзисторов, улучшения изоляции затвора и уменьшения суммарного тока утечки МОП-транзисторов, разработчикам кристаллов приходится внедрять другие прогрессивные методы энергосбережения, основанные на архитектурных решениях, поскольку нет процессоров с нулевой потребляемой мощностью.

При разработке ориентированных на использование в мобильных приложениях процессоров OMAP35xx большое внимание было уделено не только уменьшению габаритных размеров систем в случае использования этих процессоров, но и снижению энергопотребления. Для оптимального управления производительностью и уровнем потребляемой мощности в этих процессорах реализована т.н. технология SmartReflex, позволяющая контролировать и управлять энергопотреблением и производительностью основных узлов процессора, включая процессорное ядро, аппаратные ускорители, периферийные контроллеры и т.д.

Алгоритм управления энергопотреблением построен по принципу объединения узлов и блоков процессора в домены и управления уровнем мощности, потребляемой каждым из них.

Применение технология SmartReflex позволяет обеспечить совместимость не только на уровне операционной системы, но и на уровне программных продуктов управления энергопотреблением, предлагаемых многочисленными производителями. На уровне системного программного обеспечения технология SmartReflex включает ПО, управляющее другими технологиями более низкого уровня, которые имеют соответствующую аппаратную поддержку  [2]. Например, технология SmartReflex позволяет осуществлять мониторинг и прогнозировать рабочую загрузку процессора, поддерживает менеджер ресурсов и программный драйвер устройства управления электропитанием.

Использование этой технологии позволяет также эффективно решать задачи оптимального управления энергопотреблением, благодаря чему изготовители комплексного оборудования производят миниатюрные портативные устройства с возможностью мультимедийной обработки. В технологии SmartReflex реализовано несколько механизмов снижения суммарного уровня энергопотребления, но в основном она базируется на следующих трех «китах»:

– системе динамического регулирования тактовой частоты и напряжения питания (Dynamic Voltage and Frequency Scaling — DVFS);

– системе динамического отключения напряжения питания (Dynamic Power Switching — DPS);

– системе управления токами утечки в режиме ожидания (Standby Leakage Management — SLM).

Система динамического регулирования тактовой частоты и напряжения питания (DVFS) обеспечивает уменьшение до минимально возможных значений напряжения питания и тактовой частоты процессора в активном режиме, снижая тем самым до минимума интервалы времени, в которых процессор находится в режиме ожидания. Система DVFS обеспечивает динамический выбор оптимальной тактовой частоты и напряжения питания до значений, необходимых для выполнения конкретного вычислительного процесса в заданном временном интервале, что позволяет, в конечном счете, уменьшить суммарную потребляемую мощность в активном режиме при условии выполнения задачи в том же временном интервале.

Принцип работы системы DVFS поясняют диаграммы работы процессора, приведенные на рисунке 5. В случае работы с максимальной тактовой частотой и соответственно при максимальном напряжении питания вычислительный процесс, для выполнения которого зарезервирован временной интервал в 4 с, можно завершить в течение 1 с. Оставшиеся 3 с процессор будет находиться в режиме ожидания (см. рис. 5, а). Во втором случае (см. рис. 5, б), снизив тактовую частоту и напряжение питания до оптимальных для выполнения задачи значений, также потребуется интервал времени 4 с, а режим ожидания будет исключен вовсе. В рассмотренном примере средняя потребляемая мощность во втором случае оказывается меньше, чем в первом (см. рис. 5).

Рис. 5. Диаграммы работы процессора без использования системы DVFS (а) и с ее использованием (б)

Таким образом, выбирая для отдельных узлов процессора оптимальные значения тактовых частот и, следовательно, напряжения питания, можно для каждого из блоков подобрать оптимальный и в то же время обеспечивающий выполнение конкретной задачи режим работы (Operating Performance Points — OPP), что позволит снизить до минимума уровень энергопотребления этих узлов. Однако на практике обеспечить для каждого из модулей процессора оптимальные напряжение питания и тактовую частоту сложно по многим причинам. Значительно проще реализовать систему DVFS, обеспечивающую несколько режимов работы OPP, с дискретными парами значений напряжения (V) и частоты (F). Для каждого их этих режимов тактовая частота соответствует максимально возможной для заданного напряжения питания, что позволяет достичь требуемого уровня производительности процессора (см. рис. 6).

Рис. 6. Загрузка процессора и OPP-режимы

При первоначальной инициализации системы DVFS процессор работает в OPP-режиме, обеспечивающем необходимую производительность в текущем временном интервале. Оптимальный OPP-режим для конкретной задачи определяет пользователь и, при необходимости, переключает процессор в наиболее экономичный режим.

Как и DVFS, система динамического отключения напряжения питания (DPS) позволяет снизить уровень энергопотребления процессора. Однако если система DVFS позволяет уменьшить как потребляемую ИС мощность в динамическом режиме, так и мощность потребления за счет токов утечки, система применение DPS снижает только одну из составляющих суммарной мощности потребления, обусловленную токами утечки.

Использование DPS-системы обеспечивает в течение периода работы процессора динамическое переключение из режима с высокой потребляемой мощностью в режим со сниженным уровнем энергопотребления. При инициализации системы DPS, чтобы как можно быстрее завершить выполнение текущей задачи, процессор работает с наивысшей производительностью (при максимальном напряжении питания и тактовой частоте), а затем автоматически переключается в режим с низким энергопотреблением для минимизации суммарной мощности потребления. Как правило, применение системы DPS целесообразно в тех приложениях реального времени, в которых процессор находится в режиме ожидания сигналов запроса на прерывание, а основные вычисления осуществляются после их прихода. Если время задержки при переключении в активный режим («время пробуждения») соответствует заданным требованиям, процессор может переключиться в режим со сниженным уровнем энергопотребления. Принцип работы системы DPS заключается в максимальном увеличении продолжительности интервалов времени, в которых процессор находится в режиме ожидания («спячки»), что позволяет, в конечном счете, снизить суммарный уровень энергопотребления.

Принцип работы системы DPS поясняют диаграммы работы процессора, приведенные на рисунке 7. В первом случае (см. рис. 7а) приведена диаграмма работы без использования системы DPS, во втором случае (см. рис. 7а) — с DPS. В режиме ожидания (idle) потребляемая процессором мощность определяется величиной тока утечки. При инициализированной системе DPS ток утечки снижается до нуля. Однако перед переключением процессора в энергосберегающий режим (в котором ток утечки снижается до нуля), как правило, может потребоваться сохранение данных, а для последующего перехода после «пробуждения» в активный режим работы эти данные следует восстановить. Естественно, что сохранение и восстановление данных осуществляется в активном (динамическом) режиме, что обусловливает появление дополнительного расхода энергии, т.н. непроизводительных издержек (накладных расходов).

Рис. 7. Диаграммы работы процессора без использования системы DPS (а) и с ее использованием (б)

Для эффективной работы системы DPS необходимо динамически предсказывать производительность, требуемую для выполнения приложения. Кроме того, устройство управления системой DPS должно учитывать задержку («время пробуждения»), требуемую для переключения в активный режим, и при этом гарантировать, что сопутствующие накладные расходы не приведут к существенному снижению суммарной производительности.

В отличие от систем DVFS и DPS, использование которых позволяет управлять уровнем энергопотребления в активных (динамических) режимах работы, система SLM предназначена для снижения энергопотребления в статическом режиме. Наличие системы управления токами утечки в режиме ожидания (SLM) обеспечивает переключение процессора в энергосберегающие режимы работы в автоматическом режиме или в ответ на пользовательские запросы, в случае если не запущено приложение или активность системы ограничена. В этой ситуации обеспечивается минимальное энергопотребление в статическом режиме и, вместе с тем, сохраняется возможность реагирования на разрешенные запросы на прерывание в соответствии с допустимой задержкой.

По сути, и в системе DPS, и системе SLM для снижения уровня энергопотребления происходит переключение между активными режимами работы и режимами ожидания («спячки»). Однако подходы при организации функционирования этих систем различны.

При работе системы DPS, во-первых, необходим прогноз требуемой загрузки процессора, а, во-вторых, время задержки переключения из режима в режим составляет всего 10—100 мкс. Это вызвано тем, что более длительные интервалы переключения могут существенно снизить суммарную производительность системы. Источниками прерываний для системы DPS, как правило, являются таймеры, контроллер прямого доступа к памяти или встроенные периферийные контроллеры.

При работе системы SLM задержка переключения между режимами составляет 1—10 мс, чего вполне достаточно, чтобы обеспечить незаметный или малозаметный интервал времени «пробуждения» процессора по сравнению со временем реакции пользователя (например, в диалоговом режиме), поскольку система SLM, как правило, наиболее эффективна при обслуживании пользовательских запросов на прерывания. Источниками прерываний в таких случаях являются клавиатура, сенсорная панель и т.д.

Кроме того, в технологии SmartReflex поддерживается работа и других систем, например, системы адаптивного изменения напряжения питания (Adaptive Voltage Scaling — AVS). В процессе изготовления ИС в силу ряда объективных факторов параметры транзисторов (а, следовательно, и параметры ИС в целом) имеют разброс. По этой причине часть микросхем даже из одной и той же партии при прочих равных условиях получаются «быстрыми», а другие «медленными». «Быстрые» по сравнению с «медленными» могут работать на более высоких частотах при том же напряжении питания (см. рис. 8). Использование технологии SmartReflex позволяет учитывать эту особенность и в соответствии с параметрами сформированных транзисторов корректировать напряжение питания должным образом.

Рис. 8. Зависимость тактовой частоты от напряжения питания в «быстрых» и «медленных» процессорах

Уникальные возможности SmartReflex 2 благодаря технологиям FBB (Forward Body Biasing — прямое базовое смещение) и RBB (Reverse Body Biasing — обратное базовое смещение) позволяют повысить быстродействие транзисторов и снизить их ток утечки [2]. Испытания показали, что технология FBB может улучшить параметры транзисторов на 15%, а технология RBB — снизить ток утечки до 40% в зависимости от температуры.

Справедливости ради следует отметить, что компания Texas Instruments далеко не единственная, которая в своих изделиях применяет технологии снижения энергопотребления. Например, компания Freescale Semiconductor в процессорах семейства i.MX3xx/5xx также использует системы, аналогичные AVS. Это система DPTC (Dynamic Process Temperature Compensation), а также система динамического регулирования тактовой частоты и напряжения питания DVFS. Кроме того, внедренная еще в процессорах i.MX31/31L т.н. технология Smart Speed™ Switch позволяет существенно повысить эффективность пересылки данных и выполнения команд при значительно меньшем энергопотреблении по сравнению с универсальными процессорами. При тактовой частоте ядра 532 МГц достигается производительность, эквивалентная производительности универсальных процессоров с тактовой частотой 3 ГГц. Благодаря использованию этой технологии обеспечивается возможность выполнения в одном цикле до пяти операций по пересылке данных, что позволяет реализовать не только режим потокового видео и осуществлять обмен информацией в режиме видеоконференции, но и снизить суммарный уровень энергопотребления за счет более эффективного использования системы команд процессора.

Заключение

Давление рынка не позволяет расслабиться его ведущим участникам, вынужденным следовать тенденции миниатюризации. Мобильные устройства, а также другие портативные приборы и системы, работающие от источников энергоснабжения с ограниченным ресурсом, должны отличаться как минимальными размерами, так и пониженным уровнем энергопотребления. Технология SmartReflex, предложенная и реализованная компанией Texas Instruments, как и процессоры семейства OMAP2ххх/3ххх с их широкими мультимедийными возможностями, — не только очередной шаг на пути создания мобильного информационного сообщества, но и средство достижения монопольного положения на рынке ИС и получения новых сверхприбылей.

Вместе с тем, нельзя не упомянуть об обратной стороне современных информационных «электронных достижений». Президент США Барак Обама во время вручения дипломов выпускникам Хэмптонского университета (Hampton University) в своей речи, в частности, сказал, что информация перестает быть средством обеспечения прав и свобод граждан, нанося иногда вред не только отдельно взятым людям, но и стране в целом, а также принципам демократии [5, 6].

«Вы становитесь взрослыми в эпоху СМИ, которые круглосуточно обрушивают на нас разнообразную информацию и приводят аргументы, которые не всегда имеют высокий рейтинг по шкале правды. Я не знаю, как работают все эти iPods, iPads, Xboxes и PlayStations, но информация превращается из инструмента реализации возможностей в развлечение и приятное времяпрепровождение. Это оказывает дополнительное давление не только на вас, но и на нашу страну и демократию», — сказал президент [5, 6].

Тем временем, компания Texas Instruments анонсировала новые мультимедийные процессоры для мобильных приложений OMAP4430/4440 с тактовой частотой 1 ГГц и выше, содержащие два процессорных ядра ARM Cortex-A9 MPCore™ с поддержкой симметричной многопроцессорной обработки (Symmetric Multiprocessing — SMP) и новый еще более производительный процессор семейства DaVinci — TMS320DM8168 [7].

Более полную информацию о параметрах и возможностях процессоров OMAP см. в [1—3].

Литература

1. OMAP35x Applications Processor. Technical Reference Manual. — Texas Instruments, January 2010 (www.ti.com).

2. SmartReflex™ Power and Performance Management Technologies: reduced power consumption, optimized performance. — Texas Instruments, February 2008 (www.ti.com).

3. Power-Management Techniques for OMAP35x Applications Processors. — Texas Instruments, September 2008 (www.ti.com).

4. Statistical Modeling of Leakage in Nano-CMOS Circuits. MOS-AK Meeting MIPlaza. — Eindhoven, April 2008.

5. www.bbc.co.uk/blogs/thereporters/maggieshiels/2010/05/tech_president_obama_disses_ip.html.

6. www.wtkr.com/news/wtkr-obama-hampton-address-transcript,0,7478536.story

7. http://focus.ti.com//general/docs/wtbu/wtbuproductcontent.tsp?templateId=6123&navigationId=12843&contentId=53243#systemDiagram.

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *