Ученые Пермского Политеха нашли способ повысить отказоустойчивость электроники
Статья опубликована в сборнике трудов международной научно-практической конференции «Транспортные системы».
Микроэлектроника — это область техники, которая занимается созданием электронных компонентов и микросхем. Они представляют собой миниатюрные устройства, элементы которых неразрывно связаны и объединены между собой. Сегодня микроэлектроника лежит в основе практически любой техники: от бытовых приборов и смартфонов до сложного медицинского оборудования, систем управления самолетами, космическими аппаратами и объектов атомной энергетики.
Любая микросхема состоит из множества мельчайших переключателей — транзисторов. Именно они, включаясь и выключаясь в определенной последовательности, позволяют обрабатывать информацию, выполнять вычисления и управлять работой устройств. Чем больше транзисторов удается разместить и чем быстрее они переключаются, тем более сложные задачи способна решать микросхема.
К примеру, в современной авиации микроэлектроника отвечает за работу ключевых бортовых систем. Микросхемы непрерывно получают и обрабатывают данные с множества датчиков — о скорости, высоте, температуре двигателей, давлении воздуха. На основе этой информации автоматические системы, включая автопилот, корректируют курс, управляют тягой двигателей и обеспечивают безопасное следование по маршруту без постоянного участия человека.
В атомной энергетике микроэлектроника используется в системах контроля и управления, которые должны работать безотказно в условиях повышенной радиации и других жестких внешних воздействий. Цифровые устройства здесь отвечают за мониторинг параметров работы реактора и своевременное обнаружение отклонений. Надежность этих систем имеет первостепенное значение, поскольку от их корректной работы зависит безопасность объекта и предотвращение аварийных ситуаций.
Однако при эксплуатации микроэлектроника подвергается различным дестабилизирующим воздействиям. Это могут быть перепады температур, вибрация, электромагнитные помехи, радиационное излучение или естественный износ элементов. В результате таких воздействий возникают сбои и отказы в работе транзисторов и микросхем. Информация с датчиков может быть искажена или обработана неверно. Последствия зависят от области применения: в авиации это грозит потерей управления и авариями, в атомной энергетике — риском для безопасности объекта, в медицинской технике — неправильной постановкой диагноза или неверной работой жизненно важных приборов.
Так у инженеров появилась необходимость обеспечения не просто надежности, а так называемой «живучести» аппаратуры, то есть ее способности выполнять функции даже после получения повреждений. Для повышения отказоустойчивости сегодня применяются различные методы. Основным считается мажоритарное резервирование, при котором ключевые блоки системы многократно дублируются. Например, вместо одного процессора устанавливаются три. Все они получают одну и ту же информацию от датчиков и обрабатывают ее параллельно. Этот подход считается стандартом и используется в том числе при проектировании авиационной и космической техники.
Однако такое дублирование ведет к значительному росту энергозатрат и габаритов устройств. Альтернативный подход заключается в более глубоком резервировании — защите не только процессоров в целом, но и их ключевых элементов — транзисторов. В этом случае группа резервированных транзисторов берет на себя функцию отказавшего элемента и продолжает работать, обеспечивая отказоустойчивость аппаратуры.
У этого подхода также существуют ограничения: при использовании только резервирования транзисторов электроника работает медленнее. Сигналу требуется больше времени, чтобы пройти через сложную цепочку внутренних соединений. При этом в некоторых отраслях (например, авиации или космической технике), где решения нужно принимать за доли секунды, любое замедление критично. Кроме того, при таком подходе потребляется больше электроэнергии. Получается, что использование этих методов защиты по отдельности не позволяет одновременно добиться и высокой надежности, и необходимого быстродействия.
Ученые Пермского Политеха разработали новый метод комбинированного резервирования, который обеспечит более надежную защиту электроники от сбоев без замедления работы и роста энергопотребления. По сравнению со стандартным способом он повышает вероятность безотказной работы устройства в среднем до 25%.
Поскольку существующие методы по отдельности не позволяют одновременно достичь высокой надежности, быстродействия и энергоэффективности, исследователи предложили их комбинировать. Разработанный подход объединяет резервирование на уровне целых блоков, которое обеспечивает общую защиту системы, с резервированием на уровне транзисторов.
Эксперты выяснили, что важные характеристики (сколько энергии будет потребляться и как быстро пройдет сигнал) зависят не только от количества транзисторов, но и от того, как именно они соединены между собой. А значит, можно найти такие способы соединения, которые дадут наилучшие показатели.
Они создали специальную программу, которая описывает все допустимые варианты соединений. В нее можно ввести параметры: сколько элементов нужно зарезервировать и сколько отказов должна выдерживать система. Программа определит возможные способы, визуализирует их и выдаст результат, который можно подготовить к моделированию.
— Чтобы проверить эффективность нового метода, мы создали модель процессора, которая соответствует типичной бортовой электронике, и сравнили: что будет, если защищать его только традиционным резервированием, и если применить новый комбинированный метод. В ходе тестирования мы моделировали различные сценарии отказов — от повреждения одного транзистора до множественных сбоев, и смотрели, как поведет себя система в каждом случае. Для расчетов мы использовали стандартные инженерные инструменты и учитывали ключевые параметры: количество транзисторов, возможных отказов и время работы устройства. Это позволило смоделировать поведение в разных условиях и объективно сравнить оба подхода, — рассказал Максим Никитин, ассистент кафедры «Автоматика и телемеханика» ПНИПУ.
Результаты моделирования подтвердили эффективность разработанного метода. В зависимости от поставленной задачи он позволяет получить один из двух вариантов улучшения характеристик. С одной стороны, он обеспечивает повышение вероятности безотказной работы устройства до 25% по сравнению с традиционным резервированием. Если же требуется снизить энергопотребление и временные задержки, предложенный подход позволит уменьшить затраты энергии в среднем на 20% по сравнению с существующими решениями.
Разработка может найти применение в различных областях, где цифровая аппаратура работает в условиях жестких внешних дестабилизирующих воздействий. В авиации и космической технике, где электроника подвергается перепадам температур, вибрации и радиации. В атомной энергетике, где требуется безотказная работа систем контроля и управления. В медицинской технике, где от точности показаний зависит жизнь пациента. И, конечно, в транспортных системах, включая беспилотные автомобили.
Предложенный учеными метод позволяет создавать вычислительные системы и их элементы, которые сохраняют работоспособность даже при внутренних повреждениях и при этом обрабатывают информацию с той же скоростью, что и обычные устройства.