Сооснователь «Стафори» Владимир Свешников
рассказал, что копия голоса воссоздаётся с учётом специфического произношения слов, скорости речи, интонаций и тембра. В комментариях к ролику разработчики пояснили, что для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает.
В видеоролике нейросеть говорит тремя голосами — Владимира Путина, Владимира Познера и Ксении Собчак. Разработчики планируют использовать технологию в рекламе, озвучке аудиокниг, голосовых помощниках и тому подобных проектах.
В ролике и на сайте компания уточняет, что прежде всего заботится о безопасности клиентов:
Мы понимаем, что данные технологии могут использоваться как во благо, так и во вред, поэтому делаем всё возможное, чтобы построить легальную и прозрачную основу для их развития.
Приватность, авторские права и этичность являются для нас основными принципами.
из заявления на сайте
Как сообщает
VC.ru, компания уже подписала договор на легальное использование голоса сооснователя студии «Кубик в кубе» Руслана Габидуллина.
По словам разработчиков, Vera Voice — первая программа, способная синтезировать голоса знаменитостей на русском языке. В июле 2018-го был представлен синтезатор, который сгенерировал голос Стивена Хокинга и Билла Гейтса, а ранее стартап AI Dessa продемонстрировал ролик, в котором звучит синтезированный голос радиоведущего.