Новая нейросеть Microsoft способна подделать любой голос за 3 секунды

Автор K-News -

17:37, 10.01.2023

Корпорация Microsoft представила модель искусственного интеллекта VALL-E. Она умеет точно воспроизводить голос любого человека, для этого её хватает всего лишь трёхсекундного образца.

Зафиксировав конкретный голос, VALL-E способна синтезировать аудиозапись того, как человек произносит что-либо, пытаясь сохранить его эмоциональный тон. Сама разработка представляет собой нейронную языковую модель, в основу которой заложен EnCodec. С его помощью технология разделяет голоса человека на отдельные компоненты.

Данные компоненты, именуемые «лексемами», нейронная сеть сопоставляет с соответствующими голосами в своей обучающей базе для образования новых фраз за пределами изначального трёхсекундного образца.

Следует отметить, что Microsoft не раскрывала код VALL-E в открытом доступе из-за потенциального риска некорректного использования. К таковым в корпорации относят подмену идентификации голоса или выдачу себя за конкретного диктора.

Поделитесь новостью

Facebook VK Telegram WhatsApp X Threads Copy

Новая нейросеть Microsoft способна подделать любой голос за 3 секунды

ДРУГИЕ НОВОСТИ:

Суд ЕАЭС вынес заключение по заявлению Кыргызстана о разъяснении вопросов ОМС

В Нацбанке КР рассказали о разных видах дропперов

Пентагон сообщил Конгрессу об отсутствии признаков того, что Иран планировал напасть на США первым

ГКНБ: по факту мошенничества задержан сотрудник ГУОБДД

Садыр Жапаров прокомментировал помилование Даниэла Ажиева и скандал с вертолётом

Учёные приблизились к выращиванию волос для лечения облысения