Выбор даты релиза Qwen 2.5-Max, первого дня Нового года по лунному календарю, когда большинство китайцев отдыхают и проводят время с семьёй, подчеркивает тот прессинг, который стремительное развитие китайского стартапа DeepSeek за последние три недели оказало не только на иностранных, но и на местных конкурентов.
«Qwen 2.5-Max превосходит... практически по всем параметрам GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в заявлении облачного подразделения Alibaba, размещенном в официальном аккаунте WeChat, где упоминаются ведущие модели искусственного интеллекта с открытым исходным кодом от OpenAI и Meta.
Релиз 10 января AI-помощника DeepSeek, основанного на модели DeepSeek-V3, а также релиз 20 января модели R1 произвели фурор в Кремниевой долине и привели к падению стоимости акций технологических компаний. Низкая стоимость разработки и эксплуатации китайского стартапа вызвала сомнения у инвесторов в целесообразности значительных затрат на искусственный интеллект ведущими компаниями США.
Однако успех DeepSeek также подстегнул конкуренцию среди его отечественных соперников, ускоряя процесс обновления их собственных моделей искусственного интеллекта.
Спустя два дня после выхода DeepSeek-R1, владелец TikTok, компания ByteDance, представила обновление своей флагманской модели искусственного интеллекта, которая, по их утверждениям, превзошла O1 от OpenAI, поддержанную Microsoft, в стандартизированном тесте, оценивающем способность моделей понимать сложные команды и реагировать на них.
Это заявление перекликается с заявлением DeepSeek о том, что их модель R1 сопоставима с O1 от OpenAI по ряду тестов производительности.
Предшествующая версия модели V3 от DeepSeek, DeepSeek-V2, спровоцировала ценовую войну среди моделей искусственного интеллекта в Китае после своего запуска в мае прошлого года.
То, что DeepSeek-V2 имел открытый исходный код и был крайне доступным — всего 1 юань (около $0,14) за 1 миллион токенов или единиц данных, обработанных моделью, побудило облачное подразделение Alibaba снизить цены на ряд своих моделей до 97%.
Другие китайские технологические компании последовали этому примеру, включая Baidu (9888.HK), выпустившего первый китайский аналог ChatGPT в марте 2023 года, и Tencent, самую крупную интернет-компанию страны.
Лян Вэньфэн, таинственный основатель DeepSeek, заявил в редком интервью китайскому изданию Waves в июле, что стартап «не озабочен» ценовой войной и что его главная цель — создание общего искусственного интеллекта (AGI).
OpenAI определяет AGI как автономные системы, способные превзойти человека в большинстве экономически значимых задач.
В отличие от крупных китайских технологических компаний, таких как Alibaba, насчитывающей сотни тысяч сотрудников, DeepSeek функционирует как небольшая исследовательская лаборатория, укомплектованная главным образом молодыми выпускниками и аспирантами ведущих китайских вузов.
В своём июльском интервью Лян отметил, что, по его мнению, крупные технологические компании Китая могут быть недостаточно эффективны в будущем развитии индустрии искусственного интеллекта, сравнивая их высокие издержки и строгие организационные структуры с экономичным подходом и гибкой системой управления DeepSeek.
«Создание больших фундаментальных моделей требует постоянного новаторства, и возможности технологических гигантов ограничены», — подчеркнул он.
Если вам понравился материал, кликните значок - вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал - не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!