ЖУРНАЛ СТА №4/2024

средняя абсолютная ошибка). Описан- ные модели показали наилучшую про- изводительность: количество слоёв, ячеек LSTM и фильтров. На основе ре- зультатов выбраны перспективные кандидаты – LSTMи GRU. После анализа объёма памяти с помощью инструмен- та X-CUBE-AI и учёта компромисса меж- ду сложностью и точностью для окон- чательной оценки выбрана модель LSTM. Производительность системы оценивалась в режиме реального вре- мени в течение 30 дней. Результаты не- много отличаются от полученных на этапе валидации. 2. Интеллектуальная встраиваемая система для силовых агрегатов реали- зована на нейронной сети (DNN) на мик- роконтроллере STM32 для мониторинга приложенной нагрузки в системе транс- миссии. Цель – отслеживать состояние с помощью интеллектуальных датчи- ков, чтобы контролировать профилак- тическое обслуживание и снижать за- траты. Если известны приложенные усилия, можно оценить условия экс- плуатации и спрогнозировать возмож- ные дефекты. Для определения при- ложенных усилий измеряют вибрации с помощью ёмкостного акселеромет- ра. Использовался микроконтроллер STM32F469AI, ARM Cortex-M4 с 2 Мбайт флеш-памяти и 384 + 4 кбайт памяти SRAM, работающий на частоте 180 МГц. Быстрое преобразование Фурье (FFT) было рассчитано для сигнала вибрации и реализовано на том же микроконт- роллере. Разработчики использовали фреймворкKeras для построения нейрон- ной сети DNN. DNN состоит из трёх свёр- точных слоёв, за которыми следуют три полностью связанных плотных слоя с примерно 45 000 параметров обучения. Основная цель этой топологии – из- влечь полезные характеристики из сиг- нала вибрации в частотной области с помощью свёрточных слоёв и класси- фицировать их с использованием пол- ностью связанных слоёв. Для классифи- кации были выбраны семь факторов, что дало семь выходных классов. Пред- варительно обученная модель была ав- томатически преобразована в оптими- зированную библиотеку на языке C с по- мощью STM32Cube.AI. Общая точность составляет 97,71%, что немного ниже точности исходной модели до преобра- зования. Но даже самая низкая точность превышает 90%. Этот пример реализа- ции DNN на микроконтроллере ARM Cortex-M4 STM32 показывает хорошие результаты для промышленных прило- жений при использовании набора ин- струментов искусственного интеллекта STM32Cube. Микроконтроллер может обрабатывать алгоритмы DNN и FFT с помощью функций DSP STM32. 3. Проект реализации системы без- опасности на транспорте на базе свёр- точной нейронной сети (CNN) для обна- ружения сонливости. Система была ин- тегрирована в смарт-очки как носимое устройство. Метод сравнили с методом, который обычно используется в анало- гичных приложениях и основан на ме- ханизмах определения порогов. Для по- лучения входных данных использова- ли ИК-датчик. Обнаружение основано на событиях моргания. Это сложная за- дача, потому что могут быть разные обычные ситуации, которые можно ин- терпретировать как моргание. Авторы подробно описывают используемый на- бор данных и форму волны ИК-сигнала. Базовая архитектура CNN состоит из двух слоёв одномерной свёртки с 6 и 12 фильтрами, размер фильтра – 7 для обо- их слоёв. За каждым уровнем свёртки следует уровень объединения средних значений. В конце для прогнозирова- ния класса используется полностью связанный уровень. Модель была опти- мизирована с использованием двоич- ной функции потери кросс-энтропии и эффективной версии градиентного спуска Adam. После обучения в течение 30 эпох с использованием пакета раз- мером 10 средняя точность за 5 итера- ций составила 98,2% ± 0,8%. Для повы- шения точности были изменены коли- чество свёрточных слоёв и количество фильтров на слой, а также размер фильтров и тип операции понижаю- щей выборки. В результате было пред- ставлено семь моделей CNN с наилуч- шей точностью. Самая высокая средняя точность составила 99,5%. Микроконт- роллер, встроенный в очки, принадле- жит к семейству STM32L451xx. Он раз- работан на 32-разрядном ядре ARM Cortex-M4 и работал на частоте 40 МГц. Объём памяти ROM – 512 кбайт, опера- тивной памяти – 160 кбайт. Для пре- образования предварительно обучен- ных моделей использовался набор ин- струментов X-CUBE-AI. Помимо огра- ничения точности, было дополнитель- ное требование приложения – ограни- чить объём используемой памяти ROM 90 кбайт. В результате X-CUBE-AI ис- пользует 47 кбайт. Авторы предоставили подробное описание различных показателей про- изводительности для всех оценивае- мых моделей по сравнению с механиз- мом, основанным на пороге. Примеры рассмотренных показателей: время вы- полнения, среднее энергопотребление, чувствительность, специфичность и точность. Они пришли к выводу, что модели CNN обеспечивают лучшую точность, чем метод, основанный на пороге. Для каждой модели они обсу- дили поведение в отношении показа- телей производительности. Самая низ- кая средняя точность составила 87,4%, а самая высокая – 90,8%. Наконец, мо- дель, показавшая наилучшую произво- дительность, имела следующие осо- бенности по сравнению с механизмом, основанном на пороге: чувствитель- ность была улучшена на 10%, специ- фичность более чем на 4% и точность – почти на 6%. 4. Проект интеллектуальной распре- делённой системы на основе искус- ственного интеллекта для сельскохозяй- ственной отрасли. Система предна- значена для обнаружения болезней ко- фейных растений с помощью нейрон- ной сети. Она может работать на уст- ройствах с ограниченными ресурсами, таких как маломощные микроконтрол- леры. Из-за ограничений облачных вы- числений (задержка и безопасность) бо- лее подходящим был признан подход граничных вычислений, поскольку об- работка выполняется непосредственно на устройстве. Приложение называется Deep Leaf и использует квантованную свёрточнуюнейронную сеть (Q-CNN), ра- ботающуюна микроконтроллере STM32. С помощью инструмента X-CUBE-AI они реализовали пять различных мо- делей: ● 32-разрядную модель с плавающей запятой; ● сжатую модель; ● квантованную модель с использова- нием TensorFlow Lite converter; ● квантованную модель с использова- нием целочисленного представления; ● квантованную модель с использова- нием представления Q-формата с фиксированной запятой. Обеспечивается анализ производи- тельности с использованием следую- щих показателей: время вывода, исполь- зование памяти и энергопотребление. Использовалась платформа разработки STM32F746GDISCOVERY с микроконт- роллером STM32F746NG на базе ядра ARM Cortex-M7. Он имеет 1 Мбайт флеш- памяти и 340 кбайт оперативной памя- ти. Функции инструмента X-CUBE-AI, такие как методы сжатия и квантова- СТА 4/2024 37 www.cta.ru ОБ ЗОРЫ