Разработчики VASA-1 рассказали, что новой системе достаточно «скормить» фотографию лица человека и короткую звуковую дорожку его речи, чтобы нейронная сеть сгенерировала крайне праводоподное видео с «говорящей головой».
Авторы технологии отмечают, что нейросеть довольно точно синхронизирует движения губ со звуком, генерирует реалистичное отображение эмоций и движений головы в режиме реального времени.
Остаётся лишь надеяться, что подобные инструменты не попадут в открытый доступ.
Комментариев пока нет
Оставьте комментарий...