Мощность нового уровня
По заявлению Google, при масштабном развертывании Ironwood достигает 42,5 экзафлопс вычислительной мощности — это в 24 раза больше, чем у El Capitan, нынешнего лидера среди суперкомпьютеров (1,7 экзафлопса).
Один чип Ironwood обеспечивает:
- 4 614 терафлопс пиковой мощности
- 192 ГБ HBM-памяти (в 6 раз больше, чем у предыдущего поколения Trillium)
- Пропускную способность памяти до 7,2 Тбит/с (в 4,5 раза выше, чем у Trillium)
При этом чип вдвое производительнее на ватт, чем предыдущее поколение, и почти в 30 раз энергоэффективнее первого TPU от Google.
От обучения — к рассуждению
Ironwood отражает смещение фокуса индустрии: от создания всё более масштабных моделей — к эффективному выводу, когда модели ИИ предсказывают, анализируют и взаимодействуют с пользователями в реальном времени.
Обучение происходит один раз, но инференс — миллиарды раз в день. Поэтому экономичность и производительность стали решающими.
Google представил линейку моделей Gemini 2.5, работающих на Ironwood. Gemini 2.5 Pro предназначен для сложных задач (например, в фармацевтике и финансах), а Gemini 2.5 Flash — для повседневных сценариев с высокой скоростью отклика. Обе модели умеют адаптировать глубину рассуждений под сложность запроса.
Генеративные способности нового поколения
Компания также показала мультимодальные возможности ИИ: генерацию изображений, видео и музыки. Инструменты могут работать вместе: например, создавать промо-видео концерта по текстовому описанию. Среди новинок — модель Lyria для генерации музыки.
Инфраструктура под капотом
Ironwood — часть широкой стратегии Google в области ИИ-инфраструктуры.
В числе новинок:
- Cloud WAN — полностью управляемая глобальная сеть с приростом производительности до 40%
- Pathways — масштабируемая среда выполнения моделей от DeepMind
- Agent Development Kit (ADK) — инструментарий для создания многоагентных ИИ-систем
- Протокол A2A — открытый стандарт взаимодействия ИИ-агентов от разных поставщиков
Для бизнеса — инфраструктура Google в открытом доступе
Google делает ставку на открытие своей ИИ-инфраструктуры для корпоративных клиентов. Учитывая, что компания самостоятельно разрабатывает TPU более десяти лет, её вертикальная интеграция даёт конкурентное преимущество перед другими облачными провайдерами.
Такой подход особенно важен для компаний, которые ранее не могли позволить себе передовые ИИ-модели из-за высокой стоимости и энергоемкости. Повышенная эффективность Ironwood и открытые стандарты взаимодействия делают передовой ИИ более доступным и удобным в развертывании.
По оценке Google, 2025 год станет поворотным моментом, когда генеративный ИИ перейдёт от одиночных ответов к системам, решающим комплексные задачи совместно — с помощью координации множества агентов. Уже сейчас Google сотрудничает с более чем 50 компаниями, включая Salesforce, SAP и ServiceNow, для развития этого подхода.
Будущее ИИ — за мощными, совместимыми и энергоэффективными системами
TPU Ironwood и сопутствующие технологии демонстрируют стратегический вектор Google: сделать ИИ более мощным, гибким и широко применимым — без потери контроля над качеством и инфраструктурой. В ближайшие месяцы рынок будет следить за тем, как конкуренты отреагируют на эти шаги, и какие стандарты станут индустриальными.
Если вам понравился материал, кликните значок - вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал - не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!