ЖУРНАЛ СТА №4/2024
В обзоре приведены данные о систе- мах, которые показали высокую эффек- тивность в приложениях с ограничен- ными ресурсами. Речь идёт о различных архитектурах глубоких нейронных сетей (DNN) и результатах их применения на базе микроконтроллеров ARM Cortex-M и недорогих аппаратных устройств и программных решений для разработки. В последние годы приложения, такие как распознавание лиц, речи, изображе- ний или рукописного ввода, обработка естественного языка и автоматическая медицинская диагностика, продемон- стрировали высокую эффективность благодаря глубокому обучению (DL). Ес- ли рассматривать структуру сложных глубоких нейронных сетей, то для них требуется ещё больше повысить про- изводительность приложений и доба- вить дополнительные функции. Но это приводит ко всё более жёстким требова- ниям к вычислительным мощностям этих платформ. Чтобы их удовлетво- рить, производители интегральных схем увеличивают количество доступ- ных ядер, рабочие частоты вычисли- тельных ядер и систем памяти, а также разрабатывают специализированные аппаратные решения. В последнее вре- мя для выполнения алгоритмов с высо- кими вычислительными требованиями в условиях ограничений потребления энергии используют специализирован- ные аппаратные ускорители вместе с си- стемами памяти, которые обеспечивают высокую пропускную способность. Но- вый класс системиспользует алгоритмы DNN для решения задач в области ин- теллектуальных встраиваемых уст- ройств. Такие приложения проще для реализации, но должны иметь очень низкое энергопотребление, так как боль- шинство этих систем работает продол- жительное время от батарей. Некоторые из таких решений можно реализовать даже на недорогих микроконтроллерах с низким энергопотреблением, напри- мер, на базе ядра ARM Cortex-M. Архитектура вычислителей, реали- зованных на базе ядра ARM Cortex-M, давно привлекает внимание разработ- чиков благодаря инструментам и под- держке встроенного программного обеспечения. Это позволяет сократить трудоёмкость и временны́е затраты на разработку. Недавний систематиче- ский обзор показал, что микроконт- роллеры STM32 и серии ARM Cortex-M – лучшие аппаратные устройства для ма- шинного обучения подобных систем. При использовании микроконтрол- леров на базе ядра ARM Cortex-M для граничных вычислений сравнивались следующие параметры: ● типичные встроенные архитектуры DNN; ● методы оптимизации (разметка, кван- тование и т.п.); ● ядро ARM Cortex-M (M3, M4, M7 и т.д.); ● результаты экспериментов с акцен- том на заявленную точность, время вывода и энергопотребление. Модели глубокого обучения обычно требуют высокой вычислительной мощности и значительного объёма до- ступной памяти, особенно современ- ные модели (SOTA – State-Of-The-Art). Поэтому некоторые приложения на ос- нове DL используют облачные сервисы крупных ИТ-компаний, популярные сервисы: для ускоренного обучения, развёртывания и управления проекта- ми глубокого обучения. Однако у под- хода с облачными вычислениями есть ряд недостатков. В классической пара- дигме облачных вычислений большое количество вычислительных задач вы- полняется в облаке. Перегрузка сети трафиком может вызвать задержки в некоторых сценариях реального вре- мени. Вывод результатов работы ней- росетей в реальном времени важен для чувствительных к задержкам прило- жений. В этом случае подход с облач- ными вычислениями может привести к значительным задержкам. Кроме то- го, есть опасения по поводу безопасно- сти передачи данных в облако. По этим причинам новая тенденция состоит в том, чтобы выполнять вычисления мо- делей глубокого обучения непосред- ственно на устройстве, а не передавать данные на удалённые устройства с вы- сокими вычислительными возможно- Нейросетевые решения на ARM-микроконтроллерах В статье представлен обзор реализации нейронных сетей на недорогих микроконтроллерах с ядром ARM Cortex-M. Эти устройства подходят для граничных вычислений и могут быть использованы в различных приложениях, особенно в сфере видеоаналитики. Развитие аппаратных архитектур цифровых сигнальных процессоров (DSP – Digital Signal Processor) сделало внедрение таких систем реальным благодаря их преимуществам: низкой стоимости, энергопотреблению и малой задержке при выполнении задач в реальном времени. В статье рассматривается новое направление исследований – применение методов искусственного интеллекта в стандартных микроконтроллерах ARM Cortex-M. ОБЗОРЫ СТА 4/2024 34 www.cta.ru Дмитрий Швецов
Made with FlippingBook
RkJQdWJsaXNoZXIy MTQ4NjUy