[ТОП11] Лучший синтезатор речи для английского языка

Ответить
Аватара пользователя
balabolka
V.I.P.

[ТОП11] Лучший синтезатор речи для английского языка

#1

Сообщение balabolka »

Фирма Voice Information Associates, Inc., специализирующаяся на новостях из мира синтеза и распознавания речи, опубликовала результаты ежегодного тестирования синтезаторов речи. В исследовании участвовали английские коммерческие голоса, доступные на момент тестирования (март 2018 года).
Были проверены голоса следующих фирм:
  • AT&T
  • Acapela Group
  • Amazon (видимо, это голоса IVONA)
  • Cepstral
  • CereProc
  • Google
  • Nuance
  • Microsoft
  • NeoSpeech
  • rSpeak Technologies
  • SelvasAI
Для тестирования использовался список из 1588 английских слов/фраз по следующим темам:
  • Числительные
  • Омографы
  • Слова иностранного происхождения
  • Акронимы и аббревиатуры
  • Имена собственные
  • Почтовые адреса
Все голоса справились с чтением текста в среднем успешно на 80%. Итоговые результаты:
  1. rSpeak Technologies (98,6% правильно прочитанных слов и фраз)
  2. Amazon (97,7%)
  3. NeoSpeech (95,6%)
  4. SelvasAI (95,4%)
  5. Acapela Group (94,7%)
  6. CereProc (90,4%)
  7. Microsoft (77,1%)
  8. Cepstral (72,2%)
  9. Nuance (71,0%)
  10. AT&T (64,5%)
  11. Google (60,7%)
Победители тестирования 2018 года - английские голоса от фирмы rSpeak Technologies.

Аватара пользователя
Lecron
Специалист

[ТОП11] Лучший синтезатор речи для английского языка

#2

Сообщение Lecron »

Неожиданно. Хваленый Гугл, со своими неройсетями и прочим машин-лёрнинг, на последнем месте. Да и лишь немного менее хваленый Нюанс, не далеко ушел.
Если не обращать внимания на 6-ю позицию, хорошо заметны две группы — молодцы (около 95% и выше) и резкое отставание остальных. Любопытно, какая этому причина?

Аватара пользователя
balabolka
V.I.P.

[ТОП11] Лучший синтезатор речи для английского языка

#3

Сообщение balabolka »

Справедливости ради надо сказать, что Google использует нейронные сети и искусственные интеллект, чтобы улучшить звучание синтезаторов речи (для изменения темпа речи, определения пауз между словами, изменения высоты голоса и т.п.). Здесь же оценивалась лишь правильность чтения английских слов, то есть знание английской грамматики. Видимо, в Google много хороших программистов, но мало хороших филологов. :reader:

Тут интересно другое. Победитель rSpeak - это голландская компания, а голоса, занявшие второе место (Amazon/IVONA), созданы командой разработчиков из Польши. Как говорил профессор Хиггинс в "Моей прекрасной леди": "Почему англичане не умеют правильно говорить по-английски?"

Ответить

Вернуться в «Сведения, обсуждения»