Создана необычная система подмены речи в роликах. Видео

Новый алгоритм может использоваться для видеомонтажа.

Исследователи из Стэнфордского и Принстонского университетов создали алгоритм, который искажает речь человека на видео. Для убедительности программа не только подстраивает голос, но и изменяет мимику, а также длину ролика, сообщает Хроника.инфо со ссылкой на Информатор.

Как рассказали разработчики, устроена их программа так: из ролика она выделяет аудиодорожку, разделяя речь человека на фонемы, — пишет НОЖ.

Далее ПО создает 3D модель лица человека, сканируя, как он двигает губами, произнося слова. Затем машина находит висемы — звуки, которые выглядят одинаково при движении губ — и использует их для создания мимики под новые фразы. В итоге из двух произнесенных слов алгоритм создает третье.

Чтобы отредактированный голос больше походил на речь модели, исследователи пользуются программой VoCo, которую они представили в 2016 году. Проанализировав небольшой монолог человека, она способна «спародировать» его голос.

Похожие статьи

Хроники ада: о жизни в Мариуполе сняли документальный фильм. Видео

Джонсон и Зеленский выступили перед Верховной Радой. Видео

В Подмосковье загорелся склад: площадь пожара составила 34 тысячи кв.м. Видео