ИИ может воспроизводить человеческие интонации.
В Facebook разработали синтезатор голоса на базе искусственного интеллекта, который умеет подражать человеческим интонациям и даже копировать голоса реальных людей. В частности, команда разработчиков научила ассистента говорить голосом основателя Microsoft Билла Гейтса.
Об этом пишет Хроника.инфо со ссылкой на 24tv.
Что известно о новой разработке? Шон Васкез и Майк Льюис из Facebook AI Research смогли преодолеть ограничения систем с помощью системы машинного обучения под названием MelNet.
Разработка способна не только воспроизводить человеческие интонации, но и подражать голосам реально существующих людей. В частности, исследователи «поделали» речь Билла Гейтса.
Как работает ИИ? Новый подход Васкеза и Льюиса заключается в том, что они использовали спектрограммы для обучения системы. Это графическая запись звуковой волны, включает в себя все особенности речи. В такой форме учить искусственный интеллект стало гораздо проще.