Компания Google разработала алгоритм, который может переводить устную речь на другой язык, не используя при этом текст и имитируя голос говорящего.

Как сообщается в блоге компании, новая система получила название Translatotron. Она исключает разделение перевода на отдельные этапы, уточняют разработчики.

Translatotron будет обрабатывать поступившее голосове сообщение как спектрограмму и создавать новую спектрограмму с переводом на заданном языке, сохраняя при этом голос человека, отправившего сообщение. Специалисты Google отмечают, что нейросеть будет совершать меньше ошибок в переводе и лучше обрабатывать имена собственные.

Обучение нейросети происходило с помощью большого количества аудиозаписей, содержавшего разговоры на английском и испанском языках, а также их текстовые расшифровки.