Новый амбициозный проект Илона Маска — суперкомпьютер xAI Colossus для искусственного интеллекта — впервые открыл свои двери для широкой публики. Журналисты сайта ServeTheHome получили доступ к объекту и подробно рассказали о кластере серверов Supermicro, сборка которого заняла 122 дня и уже активно функционирует на протяжении двух месяцев.
Серверы с графическими процессорами работают на платформе Nvidia HGX H100. Каждый сервер оснащён восемью ускорителями Nvidia H100 и универсальной системой жидкостного охлаждения Supermicro 4U с возможностью горячей замены компонентов для каждого графического процессора. Серверы установлены в стойках по восемь штук, что даёт 64 ускорителя на стойку. Внизу каждой стойки расположен дополнительный блок Supermicro 4U с резервной насосной системой и системой мониторинга стойки.
Стойки сгруппированы по восемь штук, что обеспечивает наличие 512 графических процессоров на массив. Каждый сервер имеет четыре дублирующих блока питания, коммутаторы Ethernet и коллекторы, обеспечивающие работу жидкостного охлаждения. Кластер Colossus состоит из более чем 1500 стоек или около 200 массивов. Ускорители на эти массивы были установлены всего за три недели, как рассказал ранее глава Nvidia Дженсен Хуанг.
Из-за высоких требований к пропускной способности суперкластера ИИ, который постоянно обучает модели, инженерам xAI пришлось уделить особое внимание сетевому взаимодействию. Каждая графическая карта оснащена выделенным сетевым контроллером на 400 GbE с дополнительным 400-гигабитным сетевым адаптером на сервер. Таким образом, каждый сервер Nvidia HGX H100 имеет Ethernet со скоростью 3,6 терабит в секунду — весь кластер работает на Ethernet, а не на экзотических интерфейсах, таких как InfiniBand, которые обычно используются в суперкомпьютерах.
Суперкомпьютеру для обучения моделей ИИ, включая Grok 3, необходимы не только графические процессоры, но и накопители, а также центральные процессоры. Однако информация об этих компонентах предоставляется компанией xAI лишь частично. Из цензурированных видео становится ясно, что за это отвечают серверы на чипах x86 в корпусах Supermicro, которые также оснащены жидкостным охлаждением и предназначены для работы в качестве хранилищ данных или для рабочих нагрузок, ориентированных на центральные процессоры.
На объекте также установлены аккумуляторы Tesla Megapack. При работе кластера возможны резкие колебания в потреблении энергии, поэтому эти батареи ёмкостью до 3,9 мегаватт-часов каждая установлены между электросетью и суперкомпьютером в качестве энергетического буфера.
Носимый генератор преобразует движение тела в электроэнергию
Новый носимый генератор, способный вырабатывать электричество от вибраций и даже незначительных движений человеческого тела, обещает революцию в области зарядки электроники. Представьте себе зарядку ноутбука во время набора текста или пополнение аккумулятора смартфона во время утренней пробежки! 22.11.2024 5 0 0Hynix начинает производство 321-слойной системы NAND
Компания Hynix объявила о начале массового производства первой в мире 321-слойной NAND памяти на основе трехуровневых ячеек емкостью 1 Тбит. Это значительный шаг вперед после выпуска 238-слойных систем NAND в прошлом году, что сделало компанию лидером в производстве многослойных tNAND-решений. 22.11.2024 7 0 0Анатолий Гарбузов: Резидент ОЭЗ «Технополис Москва» запустил в серию российскую микросхему для «умных» систем
Компания «Ангстрем» — резидент особой экономической зоны (ОЭЗ) «Технополис Москва» — начала серийное производство универсального микроконтроллера. 22.11.2024 10 0 0Робот-голубь раскрыл секрет полета птиц без вертикального хвостового оперения
Летающий робот, вдохновленный голубями, пролил свет на загадку того, как птицы способны летать без вертикальных хвостовых оперений, которые используются в конструкциях большинства современных самолетов. Создатели робота утверждают, что этот прототип может способствовать разработке пассажирских самолетов с уменьшенным сопротивлением воздуха, что, в свою очередь, сократит потребление топлива. 21.11.2024 172 0 0