Нейросеть YaLM 100B компании Яндекс выложили в свободный доступ. Теперь это самая большая на сегодняшний день GPT-модель нейросети, которая доступна абсолютно всем. Она предназначена для генерации и обработки текстов на русском и английском языках. Об этом ресурсу «Хабр» рассказали представители компании, которые считают, что такая инициатива даст толчок развитию генеративных нейросетей.
YaLM 100В содержит 100 млрд параметров. Это больше, чем у любой другой существующей GPT-нейросети для обработки русского языка, что позволяет выполнять практически любые задачи. Например, она может сочинять стихи, придумать рекламный слоган или описание товара для онлайн-магазина и так далее. При этом данная модель умеет классифицировать тексты по стилю речи. Яндекс использует свою нейросеть в более чем 20 проектах. YaLM 100В задействована в поисковой системе и голосовом ассистенте Алисе, а также для генерации рекламных объявлений и быстрых ответов на странице поиска. Кроме того, нейросеть помогает сотрудникам Яндекса отвечать на запросы клиентов.
YaLM 100B обучалась на суперкомпьютерах Яндекса. Она обработала 2 ТБ текстов из интернета и открытых наборов данных как на русском, так и на английском языках. Проект можно найти на GitHub.