adblock check

Microsoft представила Maia 200: ускоритель для инференса ИИ с акцентом на экономичность

В компании уже заявили, что новейший чип будет использоваться для вывода модели GPT-5.2 от OpenAI, а также для собственных решений IT-гиганта
Обложка: Scott Guthrie, Microsoft

Сегодня, 26 января, компания Microsoft официально представила миру свой новый ускоритель искусственного интеллекта под названием Maia 200, который нацелен на выполнение задач инференса ИИ (процесса использования уже обученной большой языковой модели для генерации ответов, анализа данных и многого другого). И, что примечательно, представители IT-гиганта заявили, что они разрабатывали новый ускоритель не столько с целью добиться каких-но впечатляющих результатов производительности, сколько с акцентом на существенное повышение экономической эффективности генерации токенов искусственного интеллекта.

Microsoft представила Maia 200: ускоритель для инференса ИИ с акцентом на экономичность
Изображение: Scott Guthrie, Microsoft

Для этого, например, ускоритель Maia 200, изготовленный по техпроцессу 3 нм на заводах TSMC, оборудовати собственными тензорными ядрами FP8/FP4, переработанной подсистемой памяти с 216 ГБ быстрой памяти HBM3e (скорость 7 ТБ/сек), 272 МБ SRAM, а также продвинутыми механизмами перемещения данных, которые, собственно, и обеспечивают быструю и эффективную работу массивных моделей. В результате, по словам Microsoft, Maia 200 на текущий момент является самым производительным чипом «собственного производства» среди всех решений от крупных провайдеров.

К примеру, ускоритель демонстрирует в три раза более высокую производительность FP4 (10 петафлопс) по сравнению с Amazon Trainium третьего поколения. Более того, Maia 200 превосходит по FP8-производительности (5 петафлопс) TPU седьмого поколения от компании Google, который считается весьма мощным решением в своём сегменте. Но, конечно, куда важнее, что новый ускоритель является весьма эффективным решением с точки зрения финансов.

Microsoft представила Maia 200: ускоритель для инференса ИИ с акцентом на экономичность
Изображение: Scott Guthrie, Microsoft
«Maia 200 является самой эффективной системой инференции, которую когда-либо применяла компания Microsoft. Она обеспечивает на 30% более высокую производительность на доллар, чем новейшее оборудование в нашем арсенале», — цитата из официального пресс-релиза.

Кроме того, представитель Microsoft в публикации заявил, что Maia 200 уже выступает составной частью гетерогенной инфраструктуры искусственного интеллекта компании, а также будет использоваться для множества больших языковых моделей, включая GPT-5.2 от OpenAI. Учитывая, что архитектура новой модели предоставляет возможность работы в кластерах из 6144 ускорителей, Microsoft действительно сможет собрать крайне производительные и экономически выгодные центры обработки данных, да ещё и собственными силами.

Источник

ИИ ИИ
14,7K участников
Вступить
2 комментария по лайкам по дате
Оставьте комментарий...
Оставьте комментарий...
Internet_serfer
Спойлер майкрософт в 2027

Internet_serfer
Майкрософт совсем обрели?