10 ноября 2024, 19:27

У AMD появилась своя большая языковая модель — OLMo, её могут скачать разработчики

ИИ-модель от AMD может работать на устройствах с GPU Instinct MI250 и некоторыми процессами Ryzen

Компания AMD анонсировала серию больших языковых моделей под названием OLMo. Как и другие ИИ-модели, такие как GPT 4o, они были обучены и обладают навыками рассуждения и возможностями поддерживать разговор. OLMo — модель с открытым исходным кодом c 1 млрд параметров. Она доступна для загрузки и может работать на Instinct MI250 и Ryzen AI с нейронными процессорами. AMD также предоставляет инфраструктуру для разработчиков, которые зарегистрируются в облаке AMD Developer Cloud.

Подписывайтесь на Telegram-канал про технологии

С OLMo AMD, похоже, нацелилась на центры обработки данных и небольшие организации. Дата-центры, работающие на графических процессорах AMD Instinct, хорошо подходят для запуска этой языковой модели. Однако организации, у которых нет такого оборудования, тоже могут воспользоваться преимуществами OLMo на ПК благодаря Ryzen AI и NPU. Исследователям разрешается добавлять свою информацию во время обучения и тонкой настройки ИИ, что будет соответствовать их собственным потребностям.

AMD предварительно обучила свою модель, используя кластер графических процессоров Instinct с 1,3 трлн токенов на 16 узлах, каждый из которых включал по четыре GPU Instinct MI250. Процесс проходит в три этапа, на заключительном компания осуществляла согласование с предпочтениями человека, чтобы ИИ-модель понимала человеческие ценности. AMD провела несколько тестов и сравнила результаты с другими моделями с открытым исходным кодом. В целом OLMo показала хорошие результаты в AlpacaEval2, MT-Bench и других тестах.

···

Последнее изменение:
11 ноября 2024, 06:13