Подразделение Meta Platforms*, которое входит в состав новой материнской компании Meta (ранее — Facebook*), официально представило свой новый вычислительный комплекс под названием AI Research SuperCluster (RSC). Это мощнейшее решение, нацеленное на решение множества различных задач, которые связаны с большими моделями машинного обучения на основе миллиардов параметров. В компании считают, что данный суперкомпьютер сыграет важнейшую роль в развитии будущей метавселенной с множеством виртуальных миров, в которых пользователи смогут собираться для общения, развлечений, путешествий и не только. Впрочем, пока что у вычислительного комплекса задачи немного иного плана.
Специалисты отметили, что комплекс RSC позволит разработчикам компании Meta создавать новые и уникальные системы на основе искусственного интеллекта, которые предоставят множество важных возможностей. К примеру, суперкомпьютер позволит в режиме реального времени обеспечивать перевод для больших групп пользователей, которые говорят одновременно на разных языках. Благодаря мощности кластера и искусственному интеллекту, все пользователи могут общаться в одной конференции с мгновенным переводом или, например, играть в игры с дополненной реальностью. Более того, на подобные вычислительные центры Meta возложит и контроль за запрещённым контентом на своих площадках.
А ещё разработчики и исследователи на основе RSC и систем ИИ смогут создать новейшие инструменты, которые смогут обучаться на триллионах различных примеров, работать с сотнями языковых пакетов (включая распознавание языка, акценты и диалекты) и одновременно анализировать текст, изображения и видео даже с большим количеством фоновых шумов или плохо различимой речью. И чтобы предоставить системе столь внушительный набор функций и возможностей, Meta создала действительно мощную систему — за основу RSC взял кластер из 6080 графических процессоров NVIDIA A100, которые установлены в 760 системах NVIDIA DGX A100. Все графические процессоры объединили в узлы, которые связаны между собой сетевым интерфейсом NVIDIA Quantum со скоростью передачи данных 200 гигабит в секунду. Более того, система оснащена основным хранилищем объёмом 175 ПБ, кэш-памятью объёмом 46 ПБ и NFS-памятью объёмом 10 ПБ.
Предварительные тесты в бенчмарках показали, что вычислительная мощность RSC позволяет выполнять процессы в задачах, связанных с компьютерным зрением, в двадцать раз быстрее, чем та система, которую Meta использует на текущий момент. Более того, работа с библиотекой NCCL происходит в девять раз быстрее, а обучение моделей NLP — в три раза быстрее. Соответственно, обучение на основе десятков миллиардов параметров в Meta теперь будут завершать за три недели вместо девяти.
* Деятельность Meta* (соцсети Facebook* и Instagram*) запрещена в России как экстремистская.