Loquendo Russian TTS

Русский голосовой модуль синтеза речи с эмоциональной выразительностью и стилем чтения.
Ответить
Аватара пользователя
Fenix
Администратор

Loquendo Russian TTS

#1

Сообщение Fenix »

Loquendo TTS это много раз завоевавший награды метод синтеза речи с бесподобной эмоциональной
выразительностью и неподдельно, словно живыми, голосами для всех основных языков.

Этот движок предлагает множество значительных особенностей, включая:
  1. The User-Driven Unit Selection Tool (управляемая пользователем утилита выбора объектов)
  2. предписанные и определяемые пользователем стили чтения
  3. голосовые особенности
  4. пользовательский голосовой редактор и многое другое
Ольга и Дмитрий - русское семейство голосов Loquendo. Они работают на Sapi 5 и Sapi 4. Есть возможность выбирать частоту. К сожалению, эти синтезаторы больше не развиваются, так как компания Loquendo была куплена компанией Nuance.
Судя по всему, таким образом Nuance просто убрала конкурентов, потому что в последующих версиях продуктов Nuance разработки Loquendo почти не использовались. Это коснулось и русских голосов.
На сколько мне известно, Дмитрий был выпущен позже Ольги и по качеству, он даже превосходил её. К сожалению, полной версии Дмитрия нет в общем доступе. Есть только версия, собранная из компонентов для навигаторов. Она довольно низкого качества.

:download: Ольга и Дмитрий

Инструкция по установке в архиве... пароль на архив: mytts


:music: Образец чтения:
{Loquendo Ольга} Ж. Верн - Таинственный остров
loquendo_olga.mp3
(8.61 МБ) 823 скачивания

Оригинальные семплы Ольги и Дмитрия с сайта Loquendo;
Дмитрий
dmitri.mp3
(465.71 КБ) 834 скачивания
Дмитрий (2)
dmitri2.mp3
(377.14 КБ) 758 скачиваний

Внимание: это образцы полной версии Дмитрия. В архиве, который представлен здесь, версия невысокого качества и звучит она хуже. Полной версии в свободном доступе нет.


Ольга
olga.mp3
(394.69 КБ) 728 скачиваний
Ольга (2)
olga_v2.mp3
(434.69 КБ) 655 скачиваний

Аватара пользователя
Lecron
Обыватель

Loquendo Russian TTS

#2

Сообщение Lecron »

Если кого-то напрягают сибилянты, резкий звук произношения букв "с" и "т", и есть возможность встроить в свой процесс ffmpeg, их можно неплохо устранить.

Код: Выделить всё

ffmpeg -i orig.wav -af deesser=i=0.3:m=0.7:f=1:s=o result.mp3
Также, если прослушиваете на смартфоне, то его звуковой тракт настроен на другую частоту дискретизации и при воспроизведении 32к голоса производит передискретизацию, которая на смартфонах менее качественная. Это тоже можно исправить. Ангроид-программой Audio buffer size, узнаете родную частоту смарта и настраиваете на нее ffmpeg. Например для 48к

Код: Выделить всё

ffmpeg -i orig.wav -ar 48000 -af aresample=resampler=soxr,volume=-4dB,deesser=i=0.3:m=0.7:f=1:s=o result.mp3
У ffmpeg есть еще много возможностей. Сохранение в разные форматы mp3, aac, opus. Ускорение звука, для которого есть более качественные приложения, но для небольших значений 20-30% подойдет. Другие различные фильтры.
При использовании консольной версии "Балаболки" balcon, можно обойтись без промежуточного файла.

Код: Выделить всё

balcon.exe -f fragment.txt -o --raw | ffmpeg.exe -f s16le -ar 32k -ac 1 -i - -af описание_фильтров -ar дискретизация fragment.opus 

Ответить

Вернуться в «Loquendo Ольга и Дмитрий»