Проблемы определения надежности устройств


В статье рассмотрены основные понятия, связанные с расчетом надежности. Приведен расчет наработки на отказ с наглядным примером.

Основные понятия

Надежность можно определить как вероятность того, что устройство будет корректно функционировать в течение указанного промежутка времени. Главная задача заключается в расчете срока службы, поскольку он должен быть указан в документации до того, как устройство перейдет в пользование. Определение срока службы экспериментальным путем затруднено, а иногда невозможно ввиду больших временных затрат. Как правило, срок службы устройства или системы составляет несколько лет.

Безотказность – свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени.

Долговечность – свойство объекта сохранять работоспособное состояние при установленной системе технического обслуживания и ремонта.

Ремонтопригодность – свойство объекта, заключающееся в приспособленности к поддержанию и восстановлению работоспособного состояния путем технического обслуживания и ремонта.

Сохраняемость – свойство объекта сохранять в заданных пределах значения параметров, характеризующих его способность выполнять требуемые функции во время хранения, а также при транспортировке и после нее.

Перечисленные важнейшие свойства надежности характеризуют определенные технические состояния объекта. Различают пять основных видов технического состояния объектов.

Исправное состояние – состояние объекта, при котором он соответствует всем требованиям нормативно-технической и проектной документации.

Неисправное состояние – состояние объекта, при котором он не соответствует хотя бы одному из требований нормативно-технической и проектной документации.

Работоспособное состояние – состояние объекта, при котором значения всех параметров, характеризующих способность выполнять заданные функции, соответствуют требованиям нормативно-технической и проектной документации.

Неработоспособное состояние – состояние объекта, при котором значения хотя бы одного параметра, характеризующего способность выполнять заданные функции, не соответствует требованиям нормативно-технической и проектной документации.

Предельное состояние – состояние объекта, при котором его дальнейшая эксплуатация недопустима или нецелесообразна, либо восстановление его работоспособного состояния невозможно или нецелесообразно.

Согласно ГОСТ 27.002-89, для оценки надежности используется термин «наработка на отказ» – наработка с момента восстановления работоспособного состояния после отказа до возникновения следующего отказа. Это определение применимо к ремонтопригодной продукции, при эксплуатации которой допускаются многократно повторяющиеся отказы. В английской литературе данный параметр обозначается аббревиатурой MTBF (mean time between failures) – среднее время между отказами.

В случае не подлежащей ремонту продукции используется термин «наработка до отказа» – наработка от начала эксплуатации до возникновения первого отказа. Эквивалент в английской литературе – MTTF (mean time to failures). Наработка на отказ – это важный параметр для определения срока службы системы или устройства.

Зачастую производитель указывает гарантийный срок (lifetime warranty), в течение которого параметры изделия соответствуют тем, что значатся в документации. Средняя наработка на отказ определяется как отношение суммарной наработки восстанавливаемого устройства к количеству отказов, происшедших за суммарную наработку:

где ti – наработка между i-1 и i-м отказами, ч; n(t) – суммарное количество отказов за время t.

Первые методики прогнозирования надежности появились в 50-х гг. Они закреплены в стандарте MIL-HDBK-217, который с тех пор обновлялся всего шесть раз (последняя редакция датируется 1995 г.). Недавние исследования показали, что имеющиеся методики не обеспечивают точного результата в силу нескольких причин, среди которых:

  • справочные данные, на основе которых проводится расчет, быстро устаревают;
  • приняты во внимание не все типы отказов;
  • не учтены конструктивные особенности устройств.

В результате прогнозирования надежности получают коэффициент, описывающий сложную систему через степень интенсивности отказов. Прогнозирование целесообразно использовать для предварительной оценки надежности и эксплуатационных расходов, однако достоверных результатов оно не обеспечивает.

Табличные значения MILHDBK-217 не обновлялись с 1995 г. К тому же обновления, которые были произведены, не затронули разъемы. Таким образом, в стандарте предусмотрены только модели соединителей, которые были разработаны 35 лет назад. Кроме того, справочные данные были собраны из разных источников, в разные периоды и при разных условиях, о которых нет информации в этих справочниках. 

Ввиду перечисленных причин справочные данные отстают от технологических. Таким образом, зарождающиеся технологии не будут учтены даже после обновления данных.

Кривая отказов

При оценке надежности в MIL-HDBK-217 предполагается, что интенсивность отказов постоянна. Однако в реальности это не так, и она зависит от большого количества факторов, в частности от условий эксплуатации и оставшемуся сроку службы компонента.

На рисунке 1 представлен пример кривой интенсивности отказов для электронного устройства. По вертикальной оси отложена вероятность выхода устройства из строя. По горизонтальной оси – время без соблюдения масштаба. Левая кривая перед красной границей соответствует времени, в течение которого большая часть устройств выходит из строя при наличии брака. На этом этапе производится отсев бракованных устройств на заводе. Как правило, время выявления брака не превышает 50 ч, количество испытуемых устройств невелико.

Рис. 1. Интенсивность отказов
Early life period – начальный период работы; constant life period – период стабильного функционирования; wear out life period – период износа; burn in – нормализация параметров; hours – часы; years – годы; time – время

На втором горизонтальном участке вероятность отказа примерно постоянна. Длительность этого участка и есть наработка на отказ. Как правило, половина этого времени используется производителем в качестве ориентира для определения гарантийного срока. Далее кривая демонстрирует увеличение вероятности отказов. Имеются ввиду не только поломки, но и отклонение параметров работы изделия от заявленных. Это увеличение обусловлено тем, что ряд элементов в устройстве достигает жизненного предела из-за технологии изготовления, т.е. наступает технологический износ элементной базы. Таким образом, время наработки на отказ статистически определяет время работоспособной жизни устройства при заданных условиях эксплуатации.

Расчет надежности

Наиболее простым способом расчета надежности является вычисление отношения общего времени работы к общему количеству отказов. Этот способ применим для оценки массовых продуктов, а также для оценки надежности устройства на основе оценки работы аналогичных устройств предыдущего поколения. Чаще всего надежность определяется на первых стадиях спецификации.

Альтернативным способом определения надежности является вычисление отношения общего времени работы к общему количеству устройств. Отметим, что оба способа не обеспечивают абсолютной точности.

Производитель, как правило, определяет наработку на отказ на основании заявленной надежности используемых компонентов, результатов кратковременных интенсивных испытаний партии изделий и расчетов, учитывающих множество меняющихся во времени причин, влияющих на надежность изделия. При расчетах используются методики, применяемые для устройств военного назначения. Стандартом предусматривается, чтобы время наработки на отказ было приведено в часах, а не в годах.

Рассмотрим пример. В течение года тестировалось 1000 изделий. За время испытаний 10 изделий вышло из строя. Отсюда наработка на отказ составляет 1 год × (1000 шт/10 шт) = 100 лет = 876580 ч. Производитель округлит этот показатель до 900 тыс. ч, потому что продавец все равно предоставит гарантию 2–3 года. Итак, 900 тыс. ч – это срок, по истечении которого существует высокая вероятность того, что изделие конкретной серии выйдет из строя. В то же время опираться на одну величину, характеризующую надежность, не следует. Ниже рассмотрен пример, в котором надежность устройства зависит от условий установки и эксплуатации.

Одним из факторов, который не учитывается при расчете надежности, является виброперемещение печатной платы. Хотя компоненты на платах на рисунке 2 расположены одинаково, надежность у этих устройств очень разная. Причина очевидна: на одной плате имеются четыре винта, на другой – шесть.

Рис. 2. Сравнение профилей вибрации. (Слева плата закреплена 4 винтами, справа – шестью. Плата справа характеризуется более высокой надежностью)

На рисунке 3 рассматривается расположение резистора, установленного методом поверхностного монтажа. На первой плате резистор расположен в области, которая сильно вибрирует, а на второй плате резистор расположен на краю, и его срок службы увеличивается. Эти два примера позволяют обнаружить слабости методики MIL-HDBK-217.

Аппаратные отказы делятся на механические и электронные. Про­гно­зи­ро­вание должно быть проведено не только относительно электронных компонентов, но и относительно моделей, технологического процесса, износа, программной части и внешних факторов (обслуживающий персонал и т.д.).

Рис. 3. Варианты размещения резистора на плате. (Плата справа характеризуется более высокой надежностью)

Итак, при расчете надежности не учитываются такие факторы как способ установки устройства, собственная частота колебаний платы, расположение прогибов платы по отношению к компонентам, температурное распределение, влажность, вибрации, механические и температурные воздействия на компоненты в течение жизненного цикла устройства и т.д. Кроме того, предполагается, что рабочая температура и напряжение не меняются, хотя в некоторых проектах компоненты работают в нестандартных для них режимах. Это может приводить к непредвиденным отказам. Например, для силовых модулей и биполярных транзисторов с изолированным затвором двумя основными причинами отказов являются обрыв провода и отслоение кристалла. Эти процессы можно рассчитать аналитически и точно определить интенсивность и срок отказа.

Альтернатива

Для получения достоверной информации о надежности устройства необходимо обязать поставщика провести оценку надежности, которая будет состоять из двух этапов: анализ модели надежности (SRM – System Reliability Model) и An assessment of the contractor’s planned reliability Activities.

SRM – это графическое представление системы и анализ ее надежности (Reliability Block Diagram (блок-схема надежности), Fault Tree (дерево отказов), Event Tree (дерево событий)). Анализ позволит определить слабости проектируемой системы, которые могут привести к потере функциональности, безопасности и т.д., или обнаружить компоненты, отказ которых приводит к увеличению расходов.

Модель SRM описывает устройство в мельчайших деталях. Устройство разбивается на атомарные функциональные элементы и взаимосвязи между ними. Рассматривается как аппаратная, так и неаппаратные компоненты устройства, в т.ч. приобретенные готовые стандартные компоненты, арендованное оборудование, программное обеспечение, человеческие ресурсы, производственный процесс.

Когда спецификация системы закончена, приступают к предварительной оценке по стандартным критериям (интенсивность отказов, наработка на отказ и т.д.). Все допущения, источники данных и обоснования применяемых методов должны быть документально закреплены. Далее проводят оценку рисков и разрабатывают план действий, направленных на снижение риска элементов и повышение надежности системы. При проведении оценки рекомендуется использовать программный инструмент AMSAA Reliability Scorecard. Он представляет результаты анализа в наглядной форме, что позволяет быстро оценить наиболее уязвимые элементы и разработать стратегию повышения надежности устройства.

Заключение

Сложность определения надежности связана с необходимостью учета большого количества факторов, а также с невозможностью получить экспериментальные результаты. Время наработки на отказ не учитывает условий эксплуатации, поэтому к полученному значению следует относиться с осторожностью.

На основе анализа случаев возврата изделий производитель может определить доминирующие механизмы отказа, идентифицировать соответствующие модели и использовать их для оценки срока службы компонентов, которые будут применяться в конкретном приложении при известных условиях. С практической точки зрения целесообразно исследовать лишь один, наиболее уязвимый компонент системы, поскольку его выход из строя быстрее всего приведет к отказу.

Слабые места системы определяются при анализе дерева отказов или аналогичного исследования. Элементы дерева ошибок оцениваются по известным критериям, а потом выясняется, требуется ли дополнительное тестирование или доработка.

Литература

  1. http://embedded-computing.com.
  2. http://nomtbf.com/references.
  3. www.hwp.ru.
  4. http://nadegnost.narod.ru.

Читайте также:
Срок службы светодиодов и их надежность – ключ к успешной реализации светотехнических проектов
Новые MOSFET от IR: высокая эффективность и надежность
Знакомьтесь! PKC Group: устойчивый бизнес, надежность и качество
Повышение надежности и качества сложных печатных плат с помощью стандартов IPC
Методика достижения запланированного качества и надежности. Предупреждающие действия

Источник: журнал «Электронные компоненты»

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *