Yandex TTS

Ответить
speeck
Обыватель

Yandex TTS

#801

Сообщение speeck »

speeck писал(а):
29 янв 2021 13:17
Чуть позже сравню по скорости с БА и ПП
Небольшая книжка на 350кб:
БА - 0.41м.
ПП - 0.46м.
Книжка на 1.7мб:
БА - 2.07м.
ПП - 2.55м.

По мне разница не существенная, тем более для обычного использования программы (не конвейерная запись).

Но! Важное и странное наблюдение. БА пропускает некоторые правила, но не дублирующиеся, а единичные. Ниже несколько примеров. Ударения там проставлены в варианте с ПП, с БА эти ударения не проставляются, хотя других похожих правил нет вовсе. :paper:
► Показать
Единственное, что есть общего у всех этих фраз - они стоят в конце предложения, после них идет точка. Получается ̶ц̶а̶р̶ь̶ ̶н̶е̶ ̶н̶а̶с̶т̶о̶я̶щ̶и̶й̶ БА не совсем корректно работает? :roll_eyes:

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#802

Сообщение tonio_k »

speeck писал(а):
29 янв 2021 17:03
БА не совсем корректно работает?
у вас пример не удачный. нужен пример несрабатывания со всей выкладкой
К тексту
вместе с Яковцом ушел из д+Ома
Правило
из дома=из дОма
Правило Ну никак не сработает потому что в тексте присутствует + и от алгоритма ПП или БА это не зависит.

speeck
Обыватель

Yandex TTS

#803

Сообщение speeck »

tonio_k писал(а):
29 янв 2021 17:16
Правило Ну никак не сработает потому что в тексте присутствует + и от алгоритма ПП или БА это не зависит
Я же написал, что это правило сработало только с ПП, фраза уже обработана, написал итоговый результат, чтобы было понятно какой именно кусок текста.
Тут обнаружилось еще то, что во всех этих случаях, есть разрыв строки в тексте, который перед этим убирается (не помню точно каким словарем).
Только что еще обнаружил такое. Если взять фрагмент текста который не срабатывает + пару абзацев снизу-сверху, то все ок, правило срабатывает. Если взять больше абзацев (пару страниц текста), то уже нет. И в самом тексте убираются некоторые переносы строк, текст сливается :tongue2:
Еще поковыряюсь, пока сам не понимаю этой фантастики.
Если интересно, могу отправить вам в личку текст, где срабатывает правило, и где уже нет (сугубо по алгоритму БА).

Аватара пользователя
GIS88
Постоялец

Yandex TTS

#804

Сообщение GIS88 »

speeck, спасибо за сборку! Можете пожалуйста, сделать сборку для премиальных голосов, хотя бы на основе исправленных словарей от chibis. У меня они работают нормально с повторной загрузкой битых файлов и размером фрагмента 3500.

speeck
Обыватель

Yandex TTS

#805

Сообщение speeck »

GIS88 писал(а):
29 янв 2021 18:37
сделать сборку для премиальных голосов
Вы можете сами скачать сборку под Филиппа от tonio_k, и заменить в ней словари с этой сборки.
Я могу сделать, но чуть позже, сейчас катастрофически трудно со временем.
Если получится сделать на днях, отпишусь вам.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#806

Сообщение tonio_k »

speeck писал(а):
29 янв 2021 17:03
По мне разница не существенная, тем более для обычного использования программы (не конвейерная запись).
я в каком-то смысле занимаюсь популяризацией программы Демагог. Если сравнить Демагога с Балаболкой по встроенному функционалу и наваротам, то Демагог заметно проигрывает (если очень грубо - как Word против блокнота) что касается озвучки они принципиально одинаковы т.к. фактически озвучивают голосовые движки. Остаётся работа со словарями. А со словарями они работают одинаково как по скорости, так и по механизму их применения (тем не менее есть отличия. В Демагоге правила со звёздочками с большими возможностями, чем в Балаболке, а в Балаболке есть возможность через регулярные выражения менять регистр букв). Получается, что штатные и главные возможности у программ одинаковые (текст -> аудио)

Аватара пользователя
flegont
V.I.P.

Yandex TTS

#807

Сообщение flegont »

Быстрый Алгоритм (БА) дает заметный прирост в скорости применения для больших dic-словарей в тех случаях, когда доля правил со звездочками - мала, или таких правил вовсе нет.
Например, словарь ёфикации текста, примерно 300000 словоформ и ни одного правила со звездочкой. БА отрабатывает с этим словарем за считанные секунды, а Прямой Перебор - пыхтит несколько минут :smile1:
В среднем, когда доля правил со звездочкой > 1/3 то разница в скорости между БА и ПП уже становится не существенной. В таких случаях рекомендуется использовать именно ПП. Он, к примеру, позволяет (при указании в Настройках) гарантированно применить правила в точности в том порядке, как они перечислены в словаре.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#808

Сообщение tonio_k »

flegont писал(а):
30 янв 2021 14:49
то разница в скорости между БА и ПП уже становится не существенной.
кроме того, на скорость ПП ощутимо влияет размер читаемого блока, выбираемого в настройках программы. Буквально вчера (в которой раз на те же грабли :cry_baby: ) наткнулся и вспомнил про эту закономерность и добавил в скрипты увеличенный размер блока, что ускорило ПП. И в моих тестах разница в скорости между ПП и БА в словарях, запускаемых через скрипт с правилами состоящих в основном из 2-3 слов без звёздочек составила ровно 30% (БА быстрее). Будет время, ещё поэкспериментирую на определение максимального размера "блока для чтения" (начал с 44800 символов) для ПП. По идее, размер блока с целую книгу должен дать максимальное значение, но если поставить половину книги, то скорость не изменится, значит можно задать размер меньше. Почему бы не сделать размер блока "с запасом" на целую книгу и не заморачиваться? А дело в том, что тогда не получиться увидеть отображение "зеленной полосы прогресса" работы словаря. Красиво тоже должно быть! :smile1:

UPD на скорость Быстрого Алгоритма размер "блока для чтения" не влияет. А вот для словарей с Регулярными выражениями - наоборот, чем меньше читаемый блок, тем они работают быстрее.

Аватара пользователя
flegont
V.I.P.

Yandex TTS

#809

Сообщение flegont »

Размер блока чтения для ПП можно выбрать ~ 1/3 от среднего размера книги. Тогда зеленая полоска будет работать по принципу: вжик (пауза) вжик (пауза) оп! - уноси готовенького :smile1:
UPD Но мне представляется, что оптимум = ~ 40000 символов. И дальше затраты времени на работу ПП будут расти с ростом размера блока. Хотя и не так быстро, как в случае регулярных выражений :scratch:

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#810

Сообщение tonio_k »

flegont писал(а):
30 янв 2021 15:15
40000 символов.
пробовал 35.000 и 45.000 действительно 40.000 символов можно считать оптимальным, так как 45, 40, 35 у меня практически не отличаются друг от друга, а вот с дальнейшем увеличением или уменьшением начинается погрешность в сторону замедления в обе стороны.

Аватара пользователя
royx
Прохожий

Yandex TTS

#811

Сообщение royx »

Решил выложить свою сборку для Yandex TTS на Python+Selenium+chromedriver. Основная плюшка это возможность использовать прокси (для Украины). Суть в том, что программа запускает браузер, вставляет текст и нажинает на кнопку - синтезировать. В данном случае не нужен ключ и работают VIP голоса. Саму книгу ложем в файл «!!!text!!!.txt», запускаем файл «!!!Start!!!.bat». Все настройки лежат в файле «SpeechKit.py».

Аватара пользователя
olelog
Обыватель

Yandex TTS

#812

Сообщение olelog »

speeck писал(а):
28 янв 2021 19:10
Сборка:
DemagogYandexUni.rar
(17.98 МБ) 30 скачиваний
Хотел попробовать вашу сборку, ничего не получается вообще. При открытии программы сразу выскакивает окно см. первый скрин, после нажатия OK запускается окно программы, которая не видит ни голосов Максима, и не читает вообще. Вы говорили на счет инструкции, однако ее тоже нет. Если что либо выкладываете, то поясняйте как "этим" пользоваться. Написали всего много, но все это непонятно для чего. Делайте поправку на обычных пользователей.
Вложения
Image 002.png
Image 002.png (57.56 КБ) 1658 просмотров
Image 001.png
Image 001.png (84.82 КБ) 1658 просмотров

Аватара пользователя
olelog
Обыватель

Yandex TTS

#813

Сообщение olelog »

А вот нормально работающая программа от Tino_K
Вложения
Image 003.png
Image 003.png (65.78 КБ) 1658 просмотров

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#814

Сообщение tonio_k »

olelog писал(а):
31 янв 2021 13:20
, которая не видит ни голосов Максима, и не читает вообще.
нажмите клавишу F12 (подождите пока не сменится список голосов с SAPI4 на SAPI5 и в том окошке, что у вас на скриншоте, появятся установленные у вас голоса относящиеся SAPI5 (в т.ч. Максим) и перезапустите Демагог. Ошибка больше не будет выскакивать.

Далее "примерно" как в инструкции:
https://mytts.info/viewtopic.php?t=434&start=200#p5170

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#815

Сообщение tonio_k »

Что бы было "точно как по инструкции", то можете скачать сборку:
https://mytts.info/viewtopic.php?t=434&start=200#p4351

В ней удалить содержимое папок: dic и dic2

Затем из сборки https://mytts.info/viewtopic.php?t=59&start=750#p5486
Вытащить все файлы из папки dic и перенести их в папку dic первой сборки.
А дальше все как по видеоинструкции запускаете первую сборку.

Аватара пользователя
olelog
Обыватель

Yandex TTS

#816

Сообщение olelog »

Спасибо, теперь все сработало ! Попробовал прослушать с данными словарями через Максима обработанный текст, ошибок просто море, с премиум голосами такого нет и близко. Может я что неправильно сделал ? При записи данной книги через "yndx_tts64" голосом Филлипа добавил в свои словари ну примерно 150 новых слов и выражений. Для 11 часов озвучки, 150 ошибок это не так много.
Вложения
Зверев - Разборки дезертиров.txt
(1.01 МБ) 16 скачиваний
Image 004.png
Image 004.png (143.52 КБ) 1642 просмотра

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#817

Сообщение tonio_k »

olelog писал(а):
31 янв 2021 15:57
Попробовал прослушать с данными словарями через Максима обработанный текст, ошибок просто море, с премиум голосами такого нет и близко. Может я что неправильно сделал
конечно неправильно! Эти словари совсем не предназначены для Максима. Для Максима другая ветка форума

speeck
Обыватель

Yandex TTS

#818

Сообщение speeck »

olelog писал(а):
31 янв 2021 13:20
Вы говорили на счет инструкции, однако ее тоже нет. Если что либо выкладываете, то поясняйте как "этим" пользоваться. Написали всего много, но все это непонятно для чего. Делайте поправку на обычных пользователей
Как забавно, когда я пришел на этот форум, то точно также рассуждал, прямо буквально :big_smile:
Будут вопросы - пишите, поясню, но tonio_kвам уже ответил.
Данная сборка сугубо под движок Яндекса старой версии (не Филипп), ну и вообще она максимально упрощена. Инструкции смотрите в сборке у tonio_k, т.к. это все суть одна система, у меня только лишь словари чуть изменены.

speeck
Обыватель

Yandex TTS

#819

Сообщение speeck »

royx писал(а):
31 янв 2021 12:58
Решил выложить свою сборку для Yandex TTS на Python+Selenium+chromedriver
Интересно будет посмотреть. Но тут уже есть сборка chibis под Премиум, причем, там уделено внимание ошибкам записи, и в случае ошибки записи определенного отрезка, скрипт пытается записать его повторно, и в целом делает это успешно (исходя из личных тестов). Есть ли у вас подобная обработка? Да, и, вопрос, разве Яндекс банит украинские/какие-либо еще ip?

Аватара пользователя
olelog
Обыватель

Yandex TTS

#820

Сообщение olelog »

speeck писал(а):
01 фев 2021 00:12
Как забавно, когда я пришел на этот форум, то точно также рассуждал, прямо буквально
Будут вопросы - пишите, поясню, но tonio_kвам уже ответил.
Данная сборка сугубо под движок Яндекса старой версии (не Филипп), ну и вообще она максимально упрощена. Инструкции смотрите в сборке у tonio_k, т.к. это все суть одна система, у меня только лишь словари чуть изменены.
Ну вы уж не сгущайте то краски, вопрос был не в премиум голосах, а в том, что при запуске, ваша сброка не видела движки вообще. Просто предполагал, что в вашей сборке уже есть "встроенные" старые движки от яндекса, а не одни упрощенные словари, поэтому интересно было попробовать. А то, что ваши словари не подходят к yndx_tts64 у меня вопрос не возникал вовсе. Проверил полезность вашей сборки для себя, и убедился что мне это вовсе не надо. А yndx_tts64 работает отлично, все пропущенные фрагменты великолепно дописывает. Для меня двух встроенных в сборку словарей вполне хватает, которые постоянно дорабатываю.

speeck
Обыватель

Yandex TTS

#821

Сообщение speeck »

olelog писал(а):
01 фев 2021 08:51
вопрос был не в премиум голосах, а в том, что при запуске, ваша сброка не видела движки вообще
Слушайте, ну вы даже не поняли что это за сборка, а упорно высказываете свое недовольство. Простите, что поделился с вами своей сборкой :big_smile: Над которой, к слову, работал несколько месяцев, ковыряясь в словарях, которые за многие годы набрали кучу всего лишнего и даже вредного.
olelog писал(а):
01 фев 2021 08:51
Просто предполагал, что в вашей сборке уже есть "встроенные" старые движки от яндекса
Встроенные движки от Яндекса? Вы сами понимаете, что ищете? Вам нужен оффлайн движок от Яндекса? Эта сборка, как и оригинальная сборка от tonio_k, работает с Яндексом в онлайн режиме через скрипты. Для вызова скрипта нужно нажать CTRL+F2 и выбрать нужный. И тд.
Если вам упорно не нравится моя сборка, возьмите сборку от tonio_k (где "вшит" встроенный движок от Яндекса :big_smile:) и просто замените там словари на словари из моей сборки. Хотя лучше не надо, опять мне придется вам что-то доказывать :lamo: .....
olelog писал(а):
01 фев 2021 08:51
Проверил полезность вашей сборки для себя, и убедился что мне это вовсе не надо

Отлично :howdoyoudo:
olelog писал(а):
01 фев 2021 08:51
А yndx_tts64 работает отлично, все пропущенные фрагменты великолепно дописывает.
Причем тут это вообще? :roll_eyes: Вы сравниваете разные предметы, сами не понимаете еще этого? Если действительно не понимаете пишите в личку, либо можем созвониться в Тг, я объясню вам голосом, ибо нет времени расписывать одно и тоже по много раз. You are welcome.
olelog писал(а):
01 фев 2021 08:51
Для меня двух встроенных в сборку словарей вполне хватает, которые постоянно дорабатываю.
Ну и отлично, можете по случаю поделиться своими словарями, кстати. :gimmefive:

Аватара пользователя
good_cat
Администратор

Yandex TTS

#822

Сообщение good_cat »

Рекомендую понизить накал дискуссии. :butcher:
Пойду топить баню.

Аватара пользователя
olelog
Обыватель

Yandex TTS

#823

Сообщение olelog »

speeck писал(а):
01 фев 2021 11:37
Встроенные движки от Яндекса? Вы сами понимаете, что ищете? Вам нужен оффлайн движок от Яндекса? Эта сборка, как и оригинальная сборка от tonio_k, работает с Яндексом в онлайн режиме через скрипты. Для вызова скрипта нужно нажать CTRL+F2 и выбрать нужный. И тд.
Если вам упорно не нравится моя сборка, возьмите сборку от tonio_k (где "вшит" встроенный движок от Яндекса )
Никто вас не обвиняет вовсе, и никаких оффлайн движков я не ищу, зачем так утрировать ? Я просто написал, что это не то, что предполагал. Еще раз хочу сказать вам спасибо за ваш труд. :thank:

Аватара пользователя
good_cat
Администратор

Yandex TTS

#824

Сообщение good_cat »

speeck писал(а):
28 янв 2021 19:10
В приложенных гибридная сборка DemagogYandex, попытка объединения сборок tonio_k + wasyaka.
Уважаемый speeck, прослушал несколько книг с Вашей сборкой (признаюсь прямо, я не очень большой любитель online-TTS).

Хотелось бы предложить несколько улучшений.

Не все смогут изменять сами параметры конфигурации в файле конфигурации $UserForm.txt. Если работа над сборкой будет продолжена, было бы хорошо, если бы была возможность изменения параметров голоса через скрипт. Скорость чтения с интервалом 0.01, эмоциональность и так далее.

Проделана большая и очень качественная работа. Спасибо. :thank:

Аватара пользователя
olelog
Обыватель

Yandex TTS

#825

Сообщение olelog »

Для тех, кто использует yndx_tts64 выкладываю свой вариант словарей. Словари постоянно редактирую под Филиппа. Охотно выслушаю замечания.
Вложения
yndx_tts64всесловари.rar
(478.81 КБ) 54 скачивания

speeck
Обыватель

Yandex TTS

#826

Сообщение speeck »

good_cat писал(а):
01 фев 2021 13:49
Проделана большая и очень качественная работа. Спасибо
Wow, спасибо :smile1:
good_cat писал(а):
01 фев 2021 13:49
Не все смогут изменять сами параметры конфигурации в файле конфигурации $UserForm.txt. Если работа над сборкой будет продолжена, было бы хорошо, если бы была возможность изменения параметров голоса через скрипт. Скорость чтения с интервалом 0.01, эмоциональность и так далее.
На самом деле "моя" сборка это скорее сборка tonio_k, я лишь довольно много поработал со словарями.
Настройки голоса уже есть в ней. После выбора скрипта 10 или 20, нужно кликнуть на "Записать в аудио (mp3)" (двойной щелчок), если галочка уже стоит, они снимется, тогда снова кликнуть, и появится окошко с настройками. Там будет выбор голоса, скорость, настроение и тд.
Важно: Я внес еще одни правки в словари (спасибо tonio_k), актуальная версия доступна тут:
https://drive.google.com/drive/folders/ ... sp=sharing
Время от времени буду обновлять её там, чтобы здесь не плодить кучу версий.
К сожалению не могу отредактировать сообщение:
https://mytts.info/viewtopic.php?t=59&start=750#p5486
Там не корректная версия.

Аватара пользователя
speech
Обыватель

Yandex TTS

#827

Сообщение speech »

good_cat, я отправил там тебе в ЛС ответ. Ознакомься, пожалуйста.
Здесь всё же форум, а не базар в армянском селе.

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#828

Сообщение Primkray »

Читаю про использование SSML в Yandex SpeechKit (https://cloud.yandex.ru/docs/speechkit/tts/ssml) и не вижу тэга для смены голоса в процессе синтеза речи. Не поддерживается в Yandex TTS?

Аватара пользователя
balabolka
V.I.P.

Yandex TTS

#829

Сообщение balabolka »

Primkray писал(а):
03 фев 2021 02:31
Не поддерживается в Yandex TTS?
Да, не поддерживается. Разработчики в "Яндексе" решили, что в этом нет необходимости: ведь можно текст для каждого голоса отправлять как отдельный запрос к серверу.

"Балаболка" не поддерживает SSML в запросах, но в программе реализован свой способ для смены голосов при чтении текста (кнопка Сменить язык справа от текста в окне "Онлайн-сервис для синтеза речи"):

Код: Выделить всё

Текст произносит один голос.{{Lang=ru-RU;kostya;1.0;n}}Текст произносит другой голос.{{Lang=}}Вновь первый голос.
"Балаболка" посылает каждую часть текста как отдельный запрос. Такой же способ применяется и для других онлайн-сервисов.

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#830

Сообщение Primkray »

Код: Выделить всё

Текст произносит один голос.{{Lang=ru-RU;kostya;1.0;n}}Текст произносит другой голос.{{Lang=}}Вновь первый голос.
А для записи tts в файл это можно использовать? И на что влияют эти параметры - kostya;1.0;n ?

Аватара пользователя
balabolka
V.I.P.

Yandex TTS

#831

Сообщение balabolka »

Primkray писал(а):
03 фев 2021 05:05
А для записи tts в файл это можно использовать?
При использовании онлайн-сервисов результатом будет звуковой файл; чтения вслух там нет.
Primkray писал(а):
03 фев 2021 05:05
И на что влияют эти параметры - kostya;1.0;n
Имя голоса, скорость речи, эмоциональная окраска (n - нейтральная). Это всё параметры голоса в Yandex SpeechKit. Если скорость речи и эмоция для всех голосов одинаковые, два последних значения можно опустить.

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#832

Сообщение Primkray »

А имя голоса можно брать из выпадающего списка на странице Демо?
lang.jpg
lang.jpg (18.25 КБ) 1376 просмотров
В Балаболке вставил в текст

Код: Выделить всё

{{Lang=ru-RU;ermil;0.9;e}}
как только tts дошел до этого кода, запись остановилась с ошибкой "no audio data".
Это связано с неправильным выбором голоса?

speeck
Обыватель

Yandex TTS

#833

Сообщение speeck »

Primkray писал(а):
03 фев 2021 08:47
А имя голоса можно брать из выпадающего списка на странице Демо?
Вот список:
► Показать

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#834

Сообщение Primkray »

Спасибо :thumbs_up:
Ого какой у них выбор богатый, не сравнить с ЦРТ...

Аватара пользователя
Petrarca
Прохожий

Yandex TTS

#835

Сообщение Petrarca »

Привет, хотел спросить реально ли нужна обработка словарями для премиум голосов? Они вроде и так отлично читают. Хуже не сделают?

speeck
Обыватель

Yandex TTS

#836

Сообщение speeck »

Petrarca писал(а):
03 фев 2021 13:17
Привет, хотел спросить реально ли нужна обработка словарями для премиум голосов? Они вроде и так отлично читают. Хуже не сделают?
Я прослушал несколько часов в обоих вариантах, для себя решил, таки нужна обработка.

Аватара пользователя
Lecron
Специалист

Yandex TTS

#837

Сообщение Lecron »

tonio_k писал(а):
29 янв 2021 14:25
Может он прокомментирует эту разработку?
Не понравилось. issue с ошибками там есть и от меня.
tonio_k писал(а):
29 янв 2021 14:25
Лично у меня нет даже базовых знаний как воспользоваться выложенным Lecron наработками что бы хотя бы пощупать, не говоря о том, что бы попробовать это как-то на каком-то этапе прикрутить к Демагогу.
Вроде пример с демо довольно понятен. Если есть конкретные вопросы, можно обсудить в личке.
Кстати, написал такой словарик для своего пакета. Да, тоже иногда допускает ошибки, но в целом прекрасно совмещает падежи, рода, числа (единственное/множественное) и порядковость (один/первый).
11_numeric.rex.zip
(5.83 КБ) 26 скачиваний
Лишнее подтверждение, что в правой части rex нужно уметь вызывать функцию. Не важно, питоновскую или луа. В коде можно многое сделать проще, понятнее и качественнее.

Аватара пользователя
speech
Обыватель

Yandex TTS

#838

Сообщение speech »

Primkray писал(а):
03 фев 2021 12:58
Ого какой у них выбор богатый, не сравнить с ЦРТ..
А толку-то? ))
Если бы еще количество сопровождалось качеством, то и претензий бы не было.
А так по факту - куча голосов с траблами, и пять голосов с чуть меньшим количеством ошибок.
Ты посмотри теле-голоса ЦРТ. Они чистые. Я точно не уверен для длинных отрезков, но в демке именно так - они говорят лучше чем полные версии.
Если что, я не конкурент Яндекса, и достаточно взглянуть на Гугл! Там всего 5 голосов - как и у ЦРТ. И сделаны на голову стабильнее. :howdoyoudo:

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#839

Сообщение Primkray »

speech писал(а):
06 фев 2021 22:32
Ты посмотри теле-голоса ЦРТ. Они чистые.
Не спорю, у ЦРТ голоса очень качественные и приятные, но только один мужской голос, очень жаль...

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#840

Сообщение Primkray »

balabolka писал(а):
03 фев 2021 06:52
И на что влияют эти параметры - kostya;1.0;n
Имя голоса, скорость речи, эмоциональная окраска (n - нейтральная). Это всё параметры голоса в Yandex SpeechKit. Если скорость речи и эмоция для всех голосов одинаковые, два последних значения можно опустить.
Что-то у Филиппа голос от смены эмоциональной окраски (е,g,n) вообще не меняется :sad:
А громкость этим способом можно регулировать?

Аватара пользователя
balabolka
V.I.P.

Yandex TTS

#841

Сообщение balabolka »

Primkray писал(а):
08 фев 2021 10:17
Что-то у Филиппа голос от смены эмоциональной окраски (е,g,n) вообще не меняется
Да, похоже, что разработчики решили отказаться от этого параметра: в документации он помечен как "deprecated" (устаревший).
Primkray писал(а):
08 фев 2021 10:17
А громкость этим способом можно регулировать?
Нет, такой параметр в Yandex SpeechKit отсутствует.

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#842

Сообщение Primkray »

Да, с эмоциями можно играть только на двух женских языках
Эмоциональная окраска — поддерживается только при выборе русского языка (ru-RU) и голосов jane или omazh. Не используйте этот параметр с другими голосами и языками, так как при синтезе отдельных фраз голос может отличаться от ожидаемого.

Для этих голосов нейронная сеть обучалась на трех разных датасетах с репликами диктора, в которых фразы произносились с разной интонацией: радостной, раздраженной, нейтральной. Развивать поддержку эмоций для других голосов сейчас не планируется, а в премиум-голосах выбор подходящей интонации осуществляется автоматически
А вот про изменение громкости и тембра вообще ничего не нашел.

Аватара пользователя
ВладРыков
Прохожий

Yandex TTS

#843

Сообщение ВладРыков »

Primkray писал(а):
07 фев 2021 10:40
только один мужской голос
Да ну... :big_smile:
А из женских голосов и Дарья не плохо звучит

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#844

Сообщение Primkray »

Блин, как же не хватает параметра изменения громкости голоса... :boy_crying:

Аватара пользователя
andko
Обыватель

Yandex TTS

#845

Сообщение andko »

Primkray писал(а):
09 фев 2021 14:31
Блин, как же не хватает параметра изменения громкости голоса
Зачем он нужен, есть же многочисленные проигрыватели аудио, там можно изменить все что угодно.

Аватара пользователя
balabolka
V.I.P.

Yandex TTS

#846

Сообщение balabolka »

Primkray писал(а):
09 фев 2021 14:31
Блин, как же не хватает параметра изменения громкости голоса
Громкость звукового файла можно изменить с помощью утилит FFmpeg или SoX. Пример команды для уменьшения громкости в два раза (как описано здесь):

Код: Выделить всё

ffmpeg -i input.wav -filter:a "volume=0.5" output.wav
Уменьшение громкости в два раза с помощью утилиты SoX:

Код: Выделить всё

sox -v 0.5 input.wav output.wav
В программах для синтеза речи можно указать так называемые "пользовательские кодеки" (для преобразования исходного файла формата WAVE в нужный аудиоформат). Это позволит создавать файл формата MP3 с нужной громкостью. В настройках программы в качестве команды кодека можно указать это:

Код: Выделить всё

D:\FFmpeg\ffmpeg.exe -i %Input% -filter:a "volume=0.5" %Output%

Аватара пользователя
Primkray
Постоялец

Yandex TTS

#847

Сообщение Primkray »

Да с изменением громкости звукового файла вопросов нет, понятно, что можно изменить отдельной программой. Я говорю о громкости отдельного слова или фразы при озвучке. К примеру в тексте есть фраза "он крикнул - привет". Вот слово "Привет" хотелось бы озвучить с увеличенной громкостью.

Аватара пользователя
РусланМаметьев
Прохожий

Yandex TTS

#848

Сообщение РусланМаметьев »

Здравствуйте!
Хочу озвучить книжку YANDEXом. Если кто-то может это сделать легко за 100 руб., напишите мне пож. Раньше сам делал acapella Алена, но Яндекс мне показался намного лучше, замарачиваться с бубном уже не охота.

Аватара пользователя
Nixaristix
Наблюдатель

Yandex TTS

#849

Сообщение Nixaristix »

Уже по разному экспериментирую с Филлипом, ставлю 1 поток и склеивать по 2 файла, много книжек уже прослушал так, все обрезаются постоянно, абзацы просто теряются, повторная озвучка ничего не меняет. Я так понял это у всех?

Аватара пользователя
andko
Обыватель

Yandex TTS

#850

Сообщение andko »

Nixaristix писал(а):
22 фев 2021 21:09
все обрезаются постоянно, абзацы просто теряются
Приведите примеры текста, где 1-2 абзаца теряются и не озвучиваются Филиппом, я попробую озвучить и проверить.

Ответить

Вернуться в «Онлайн-сервисы для синтеза речи»