Loquendo Russian TTS

Русский голосовой модуль синтеза речи с эмоциональной выразительностью и стилем чтения.
Ответить
Аватара пользователя
Fenix
Администратор

Loquendo Russian TTS

#1

Сообщение Fenix »

Loquendo TTS это много раз завоевавший награды метод синтеза речи с бесподобной эмоциональной
выразительностью и неподдельно, словно живыми, голосами для всех основных языков.

Этот движок предлагает множество значительных особенностей, включая:
  1. The User-Driven Unit Selection Tool (управляемая пользователем утилита выбора объектов)
  2. предписанные и определяемые пользователем стили чтения
  3. голосовые особенности
  4. пользовательский голосовой редактор и многое другое
Ольга и Дмитрий - русское семейство голосов Loquendo. Они работают на Sapi 5 и Sapi 4. Есть возможность выбирать частоту. К сожалению, эти синтезаторы больше не развиваются, так как компания Loquendo была куплена компанией Nuance.
Судя по всему, таким образом Nuance просто убрала конкурентов, потому что в последующих версиях продуктов Nuance разработки Loquendo почти не использовались. Это коснулось и русских голосов.
На сколько мне известно, Дмитрий был выпущен позже Ольги и по качеству, он даже превосходил её. К сожалению, полной версии Дмитрия нет в общем доступе. Есть только версия, собранная из компонентов для навигаторов. Она довольно низкого качества.

:download: Ольга и Дмитрий

Инструкция по установке в архиве... пароль на архив: mytts


:music: Образец чтения:
{Loquendo Ольга} Ж. Верн - Таинственный остров
loquendo_olga.mp3
(8.61 МБ) 943 скачивания

Оригинальные семплы Ольги и Дмитрия с сайта Loquendo;
Дмитрий
dmitri.mp3
(465.71 КБ) 953 скачивания
Дмитрий (2)
dmitri2.mp3
(377.14 КБ) 859 скачиваний

Внимание: это образцы полной версии Дмитрия. В архиве, который представлен здесь, версия невысокого качества и звучит она хуже. Полной версии в свободном доступе нет.


Ольга
olga.mp3
(394.69 КБ) 838 скачиваний
Ольга (2)
olga_v2.mp3
(434.69 КБ) 748 скачиваний

Аватара пользователя
Lecron
Обыватель

Loquendo Russian TTS

#2

Сообщение Lecron »

Если кого-то напрягают сибилянты, резкий звук произношения букв "с" и "т", и есть возможность встроить в свой процесс ffmpeg, их можно неплохо устранить.

Код: Выделить всё

ffmpeg -i orig.wav -af deesser=i=0.3:m=0.7:f=1:s=o result.mp3
Также, если прослушиваете на смартфоне, то его звуковой тракт настроен на другую частоту дискретизации и при воспроизведении 32к голоса производит передискретизацию, которая на смартфонах менее качественная. Это тоже можно исправить. Ангроид-программой Audio buffer size, узнаете родную частоту смарта и настраиваете на нее ffmpeg. Например для 48к

Код: Выделить всё

ffmpeg -i orig.wav -ar 48000 -af aresample=resampler=soxr,volume=-4dB,deesser=i=0.3:m=0.7:f=1:s=o result.mp3
У ffmpeg есть еще много возможностей. Сохранение в разные форматы mp3, aac, opus. Ускорение звука, для которого есть более качественные приложения, но для небольших значений 20-30% подойдет. Другие различные фильтры.
При использовании консольной версии "Балаболки" balcon, можно обойтись без промежуточного файла.

Код: Выделить всё

balcon.exe -f fragment.txt -o --raw | ffmpeg.exe -f s16le -ar 32k -ac 1 -i - -af описание_фильтров -ar дискретизация fragment.opus 

Аватара пользователя
АлександрШумейко
Наблюдатель

Loquendo Russian TTS

#3

Сообщение АлександрШумейко »

Доброго времени суток! Как вы вообще подключаете данные движки к windows 10? После установки они у меня не отображаются среди вариантов выбора в настройках виндоувс.

Аватара пользователя
tonio_k
V.I.P.

Loquendo Russian TTS

#4

Сообщение tonio_k »

АлександрШумейко писал(а):
13 окт 2020 21:18
Как вы вообще подключаете данные движки к windows 10
вот здесь ветку на форуме посмотрите. Это один из ответов на вашу проблему

Аватара пользователя
balabolka
V.I.P.

Loquendo Russian TTS

#5

Сообщение balabolka »

АлександрШумейко писал(а):
13 окт 2020 21:18
После установки они у меня не отображаются среди вариантов выбора в настройках виндоувс.
Голос Loquendo Olga - это 32-битное приложение, а операционная система у Вас 64-битная. Поэтому в панели управления Windows отображается список 64-битных голосов. Чтобы посмотреть список 32-битных голосов, выполните эту команду (в "Проводнике" или в кнопке "Пуск"):

Код: Выделить всё

C:\Windows\SysWOW64\Speech\SpeechUX\sapi.cpl
Также, список 32-битных голосов можно увидеть в любой 32-битной программе для чтения вслух ("Балаболка", "Говорилка", "TextAloud" и др.). Там будет присутствовать и голос "Ольга".

Аватара пользователя
АлександрШумейко
Наблюдатель

Loquendo Russian TTS

#6

Сообщение АлександрШумейко »

Ух, ты! А вы здесь оперативно отвечаете. У вас здесь форум другим темам посвящен, но...
Чтобы вы понимали, я сейчас занят переводом войс пака для EDDiscovery и в программе подходят все голоса совместимые с SAPI 5. До этого так же отсюда скачивал Татьяну и все работало на 7 винде х64, но после установки 10 винды х64 ни Татьяна, ни Екатерина, ни Ольга не хотят отображаться как в программе так и в винде. Ответов в интернете нету.
Спасибо за ссылки, ознакомлюсь.
P.S. Если есть еще предположения, буду премного благодарен!

Аватара пользователя
АлександрШумейко
Наблюдатель

Loquendo Russian TTS

#7

Сообщение АлександрШумейко »

tonio_k писал(а):
13 окт 2020 21:59
вот здесь ветку на форуме посмотрите. Это один из ответов на вашу проблему
Не подходит. У меня одновременно должна работать EDDiscovery (она довольно затратна по ресурсам) и игра Elite Dangerous, чтобы между ними было взаимодействие ED происходит событие, отправляет параметры -> EDD считывает параметры и находит на них фразу -> воспроизведение фразы с помощью синтезатора выбранного в EDD.

Аватара пользователя
АлександрШумейко
Наблюдатель

Loquendo Russian TTS

#8

Сообщение АлександрШумейко »

balabolka писал(а):
13 окт 2020 22:06
Чтобы посмотреть список 32-битных голосов, выполните эту команду (в "Проводнике" или в кнопке "Пуск"):
Да, голос Екатерины например нашел. Только выбрав его всеравно дефолтным используется стандартный английский мужик от винды в EDD. Приложение х64.

Аватара пользователя
balabolka
V.I.P.

Loquendo Russian TTS

#9

Сообщение balabolka »

АлександрШумейко писал(а):
14 окт 2020 14:59
Только выбрав его всеравно дефолтным используется стандартный английский мужик от винды в EDD. Приложение х64.
Я привел команду, с помощью которой можно ПОСМОТРЕТЬ список установленных 32-битных голосов. Если же нужно ВЫБРАТЬ голос и сделать его голосом по умолчанию в Windows 10, то сделать это можно только с 64-битными голосами. Такими голосами являются синтезаторы речи от Microsoft, IVONA, CereProc, Nuance, RHVoice: их установщики копируют на диск и 32-битные, и 64-битные файлы одновременно, так что эти голоса будут доступны и в 32-битных программах, и в 64-битных.

"Ольга" - это 32-битный голос, так что голосом по умолчанию в Windows он никогда не станет. Этот голос можно использовать только в 32-битных программах для чтения вслух (как "Говорилка" или "Балаболка").

О каком голосе "Екатерина" идет речь, мне неизвестно. Есть очень старая 32-битная Катерина, есть новейший голос Katya от фирмы Nuance. Старый голос "Катерина" также не удастся увидеть в списке 64-битных голосов.

А вот почему в списке нет голоса "Татьяна", это вопрос. Он 64-битный, так что должен быть доступен, и его можно выбрать голосом по умолчанию. Здесь написано, почему надо ставить голоса IVONA с осторожностью: если не повезет, после установки голоса от фирмы IVONA могут перестать работать все остальные голоса.

Ответить

Вернуться в «Loquendo Ольга и Дмитрий»