Обзор бесплатных синтезаторов речи

Обзор бесплатных синтезаторов речи

Распозновать речь мы научились хоть и, пока, только английскую, не будем стоять на месте, едем дальше, точнее в противоположную сторону — займемся преобразованием текста в голосовую речь.

Наиболее популярные и свободные синтезаторы речи, которые мне известны и с которыми я имел практический опыт: Festival, eSpeak, OpenMary.
Рассмотрим все 3 по порядку.

 Festival

ОС: Linux
Русский язык:
да (мужской голос)
Сайт: http://www.cstr.ed.ac.uk/projects/festival/

Довольно продвинутый синтезатор, поставляется со следующими языковыми пакетами: английский (в английском и американском произношении), валлийский и испанский. Также существуют и другие пакеты, такие, как кастильский испанский, чешский, финский, хинди, итальянский, маратхи, польский, русский и телугу. Festival входит в поставку нескольких дистрибутивов Linux-а. Синтезатор довольно хорошо понимает русский язык, если поиграться с написанием слов, знаками препинания можно добиться вполне вменяемой речи.

Установка

В сети уже много материалов про установку фетиваля и прикрутке русского языка, поэтому особо расписывать не буду скажу лишь, что потребуется установить сам фестиваль (ставится из репозитория — festival) и русский языковой пакет, который также устанавливается из репозитория (festvox-ru), затем следует немного подправить конфиг. Хорошая статья по этому поводу есть здесь.

Использование

В консоли:

echo "Привет" | festival --tts --language russian

  eSpeak

ОС: Linux, Windows, Mac OS X, RISC OS
Русский язык:
да (мужской голос)
Сайт:
http://espeak.sourceforge.net/

Простой, компактный, программный синтезатор речи. Если верить информации, eSpeak используется в мобильных операционных системах Android, начиная с версии 1.6, и Maemo. Версии под Windows и Linux регулярно обновляются вместе с исходным кодом, с остальными платформами дела обстоят хуже. Поддерживается множество языков, в том числе русский, английский, французский, испанский и т.д. Если брать в сравнение русскую речь — eSpeak уступает Festival, английский, франзузский, немецкий — на уровне.

Установка

В некоторых дистрибутивах линукс еСпик уже установлен, если нет — ставится он также просто из консоли (espeak), либо качаем нужную версию с официального сайта, например, в случае с Windows.

  Использование

В консоли:

espeak "Привет мир!" -vru -s 100

Где:
-v язык (ru, en, de)
-s скорость (80-450)

  OpenMary

ОС: Linux, Windows, Mac OS X
Русский язык:
да (мужской голос)
Сайт:
http://mary.opendfki.de

Молодой и, пока еще, не очень популярный синтезатор, но в то же время очень функциональный и продвинутый. Написан на Java, что позволяет ему быть платформонезависимым. Работает по принципу клиент-сервер. Обладает продвинутыми речевыми надстройками, с помощью которых можно указывать интонацию, тембр, скорость для каждого слова. Поставляется с клиентом, написанным на той же яве, с графическим интерфейсом.

Установка

Установка достаточно легкая и не требует определенных усилий, качаем ява-установщик (не забываем, что требуется Java). Запускаем установщик и следуем инструкциям. В определеный этап установки предложат выбрать языковые пакеты, которыми мы будем пользоваться, для себя я выбрал русский и английский.

Использование

Переходим в директорию установки, заходим в папку bin и запускаем сервер — maryserver. Как только сервер будет запущен, запускаем клиент — maryclient.

Если все было сделано правильно, после нажатия кнопки «Play» должно быть слышно произношения написанного текста. В папке example, директорией выше, есть примеры реализации клиентов под разные языки.

  Вывод

Festival: для средних домашних и корпоративных проектов (информирование о погоде, чтение писем, «язык» для ботов и т.п.).
eSpeak: для реализации малых задач (сообщение текущего времени, информирование о пробках, количестве писем в почтовом ящике, свободном месте на жестком диске и т.п.).
OpenMary: для крупных проектов (системы «умного дома», озвучка программ, чтение большого текста).

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *