Компания AMD анонсировала серию больших языковых моделей под названием OLMo. Как и другие ИИ-модели, такие как GPT 4o, они были обучены и обладают навыками рассуждения и возможностями поддерживать разговор. OLMo — модель с открытым исходным кодом c 1 млрд параметров. Она доступна для загрузки и может работать на Instinct MI250 и Ryzen AI с нейронными процессорами. AMD также предоставляет инфраструктуру для разработчиков, которые зарегистрируются в облаке AMD Developer Cloud.
С OLMo AMD, похоже, нацелилась на центры обработки данных и небольшие организации. Дата-центры, работающие на графических процессорах AMD Instinct, хорошо подходят для запуска этой языковой модели. Однако организации, у которых нет такого оборудования, тоже могут воспользоваться преимуществами OLMo на ПК благодаря Ryzen AI и NPU. Исследователям разрешается добавлять свою информацию во время обучения и тонкой настройки ИИ, что будет соответствовать их собственным потребностям.
AMD предварительно обучила свою модель, используя кластер графических процессоров Instinct с 1,3 трлн токенов на 16 узлах, каждый из которых включал по четыре GPU Instinct MI250. Процесс проходит в три этапа, на заключительном компания осуществляла согласование с предпочтениями человека, чтобы ИИ-модель понимала человеческие ценности. AMD провела несколько тестов и сравнила результаты с другими моделями с открытым исходным кодом. В целом OLMo показала хорошие результаты в AlpacaEval2, MT-Bench и других тестах.