Для первой модели DeepEyes, выпуск которой запланирован на первое полугодие 2024 года, будет использоваться однокристальная система (SoC) DeepEdge10Max, которая обеспечит производительность 48 TOPS (INT8). В дальнейшем, при выпуске модели во втором полугодии 2024 года, будет использоваться SoC DeepEdge10Pro с производительностью до 24 TOPS. На первое полугодие 2025 года запланировано внедрение SoC DeepEdge10Ultra, способной обеспечить пиковую производительность до 96 TOPS. Однако, стратегия ценообразования и сохранение цен на уровне 1000 юаней требуют дальнейшего обсуждения и уточнения.
Ядром архитектуры DeepEyes является инновационный чип NNP400T для нейронных сетей, разработанный компанией Intellifusion. Чип объединяет мощный процессор RISC с частотой 1,8 ГГц и 2 + 8 ядрами и GPU с максимальной частотой 800 МГц (модель DeepEdge10). Ключевым компонентом системы является высокопроизводительный процессор нейронных сетей (NPU), который повышает общую производительность системы. Для соответствия требованиям Microsoft по производительности ИИ-ПК требуется минимум 40 TOPS, а разработки Intellifusion являются многообещающими. По сравнению с текущим уровнем производительности чипов NPU на уровне всего 16 TOPS, китайский чип выглядит перспективным. Ожидается, что будущие чипы Snapdragon, способные обеспечить производительность 40 TOPS, станут новым стандартом в отрасли.
Доктор Чэнь Нин, председатель Intellifusion, предсказывает, что в ближайшие три года доля компаний, активно использующих большие языковые модели ИИ, достигнет 80%. В этом контексте значительные затраты на разработку и обучение передовых моделей ИИ, которые могут достигать десятков миллионов долларов, а также затраты на приобретение специализированного оборудования становятся серьезным препятствием для большинства компаний. Intellifusion предлагает технологии, направленные на решение этой проблемы, предлагая высокоэффективные и при этом экономичные решения для обучения и интеграции больших языковых моделей ИИ.