ЖУРНАЛ СТА №4/2024
на слой. Время вычисления составило 2,9 мс, а объём памяти – всего 35 кбайт. Были проанализированы различия между использованием функций акти- вации ReLU и tanh. В результате сделан вывод, что время вычислений значи- тельно больше (7,3 мс), а код больше (37,3 кбайт) при использовании функ- ции tanh из-за дополнительных мате- матических библиотек, которые были необходимы. 8. Мобильная система безопасности для обнаружения падений с использо- ванием рекуррентных нейронных сетей (RNNS) LSTM, работающих на микро- контроллере. Такая система полезна для мониторинга пожилых людей на пред- мет непреднамеренных падений и для отправки предупреждающих уведомле- ний в систему удалённого мониторинга при положительном результате. Авторы исходили из следующих трёх основных требований: ● должно быть обеспечено постоянное беспроводное соединение для опове- щения; ● система должна быть как можно меньше и легче, чтобы избежать воз- можных неудобств; ● система должна представлять собой устройство с низким энергопотреб- лением, поскольку оно питается от аккумулятора. Эти требования легли в основу не- обходимости внедрения системы обна- ружения падений в реальном времени, которая выполняет вычисления непо- средственно на встроенном устройстве. Миниатюрная плата SensorTile была вы- брана в качестве подходящего устрой- ства для этого приложения. Это стало возможным благодаря маломощному микроконтроллеру STM32L476JGY на ба- зе ядра ARM Cortex-M4 и дополнитель- ным доступным встроенным функциям, таким как трёхосевые акселерометры. Микроконтроллер имеет 1 Мбайт флеш-памяти и 128 кбайт оперативной памяти. Используется арифметика с пла- вающей запятой одинарной точности, чтобы избежать значительных потерь в точности, которые могли быть вызваны методами обрезки или квантования. В качестве набора данных использовался SisFall, который является одним из рас- пространённых наборов данных, доступ- ных для этого приложения. Он был раз- мечен вручную и разделён на обучаю- щий и проверочный набор (80% обучаю- щего набора и 20% тестового набора). Соответствующими классами, кото- рые были определены, были FALLS, ALLERTS и фоновый класс (BKG), кото- рый охватывает обычные действия, не связанные с падением. Результаты сравнения решений на ARM Cortex Использование микроконтроллеров на базе ядра ARM Cortex-M для прило- жений с глубоким обучением является перспективным решением. Это под- тверждается тем, что недорогая архи- тектура ARM Cortex-M очень популярна и уже широко используется в различ- ных встраиваемых приложениях. Поэ- тому добавление алгоритмов ИИ на эти платформы является следующим ло- гичным шагом. В табл. 1 представлены решения с использованием алгорит- мов периферийных вычислений на ос- нове глубокого обучения для следую- щих областей применения: прогнози- рование погоды, профилактическое об- служивание, распознавание сонливо- сти, сельское хозяйство, классифика- ция эпизодов приёма пищи, распозна- вание звуковых событий на открытом воздухе, прогнозное управление моде- лями, распознавание присутствия че- ловека на открытом воздухе, монито- ринг литий-ионных аккумуляторов, си- стемы обнаружения падений и меди- цинское применение. В обзоре указаны инструменты, используемые для об- учения моделей или преобразования их в совместимый формат для работы на микроконтроллере, архитектура мо- дели, приложение, аппаратные ресур- сы и результаты. Для встраиваемых устройств наибо- лее распространённым подходом к по- строению модели является обучение на главной рабочей станции с последую- щей оптимизацией предварительно обученной модели. Однако в последнее время растёт интерес к получению оп- тимизированной модели непосред- ственно во время обучения, например, для обучения с учётом квантования. Анализ архитектуры решений Наиболее распространёнными архи- тектурами глубоких нейронных сетей, работающими во встроенных системах на базе ядра ARM Cortex-M, являются CNN, RNN, LSTM, GRU или их комбина- СТА 4/2024 39 www.cta.ru ОБ ЗОРЫ № Модель Сфера применения Инструментарий Аппаратная платформа Итоги 1 LSTM, GRU, CNN-LSTM, CNN-GRU Прогноз погоды X-CUBE-AI toolchain, Keras, TensorFlow STM32F401RET6 ARM Cortex-M4 512 kB of Flash 84 MHz NRMSE: 0.0328 NMAE: 0.0251 2 CNN Мониторинг нагрузки в системе трансмиссии STM32Cube.AI, Keras STM32F469AI ARM Cortex-M4 2 MB of Flash 180 MHz FPU Точность: 97,71% 3 CNNs Обнаружение сонливости на основе моргания глаз X-CUBE-AI toolchain STM32L451xx ARM Cortex-M4 512 kB of Flash 80 MHz FPU Точность в диапазоне: 87,4–90,8% 4 Q-CNN Выявление болезней кофейных растений X-CUBE-AI toolchain, TensorFlow Lite STM32F746NG ARM Cortex-M7 1 MB of Flash 216 MHz FPU Точность: 96% 5 RNN Модель предиктивного контроля для анестезии Matlab RM Cortex-M3 512 kB of Flash 96 kB of SRAM 84 MHz Время ответа: 2,99 мс 6 CNN Обнаружение присутствия человека на открытом пространстве TensorFlow, CMSIS-NN STM32L476RG ARM Cortex-M4 1 MB of Flash 80 MHz FPU Время ответа: 4,01 мс 7 DNN Предиктивное управление энергопотреблением интеллектуального здания TensorFlow, Keras, EdgeAI ARM Cortex-M3 512 kB of Flash 96 kB of SRAM 89 MHz Время ответа: 2,9 мс 8 LSTM, RNNs Мобильная система обнаружения падений TensorFlow, CMSIS STM32L476JGY ARM Cortex-M4 1 MB of Flash 80 MHz FPU Точность: 98% Таблица 1. Сравнение решений по глубокому обучению с использованием ARM Cortex-M
Made with FlippingBook
RkJQdWJsaXNoZXIy MTQ4NjUy