Yandex TTS
- Pin240
- Интересующийся
-
- olelog
- Обыватель
-
Yandex TTS
Подскажите, что происходит с "yndx_tts64" ? Рвет куски текста из файлов, некоторые файлы по 3 минуты, вместо 5, короче получается бред а не книга. Может что изменить в настройках потоков обработки и скачивания файлов ?
- Вложения
-
- Image 003.png (63.91 КБ) 1589 просмотров
-
- Image 001.png (136.5 КБ) 1589 просмотров
- Pin240
- Интересующийся
-
- wasyaka
- V.I.P.
-
Yandex TTS
Не чудят, а зделали замануху - подсадили...

теперь ждут денюжку

А в это время не подсевшие


► Показать



С наступающим!


(это мой предел скорости инета)
-
- Обыватель
-
Yandex TTS
А если 1 поток поставить? Тов. chibis выше писал что-то про это.
Собственно, следовало ожидать косяков от такого вида озвучки, костыль через демо-страницу однако, лично я вообще удивлен, как chibis так ловко реализовал это

- Pin240
- Интересующийся
-
- olelog
- Обыватель
-
Yandex TTS
Поставил один поток, и вот результат ! Хотя почти в два раза дольше, зато все записалось. Если будут проблемы в дальнейшем, то отлично работает ACrow 53 версия с голосом Вальца.
- wasyaka
- V.I.P.
-
Yandex TTS
А Вас кто-то насильно заставляет его слушать? Если мне Филип не нравится - вы ж от этого его не перестанете слушать?
И там не один ермила, участвуют 5(ПЯТЬ) голосов
-
- Обыватель
-
- olelog
- Обыватель
-
Yandex TTS
Ув. "wasyaka", как я понял вы используете лицензионный ключ для Play_5 ?
И пользуясь случаем подскажите что можно с этим сделать ? Я пока вношу в словарь кучу этих "территорий")))
- Вложения
-
- Image 001.png (22.15 КБ) 1453 просмотра
- S-a-b
- Обыватель
-
Yandex TTS
Здравствуйте, поздравляю всех с наступающим Новым годом!
Лучше предлог "с" заменить на "с`"
- olelog
- Обыватель
-
Yandex TTS
Вы я понял предлагаете в каждой книге делать замену на "с`" "с мушкой")))? А как это применить для dicOMGaster и грамотно "зазвездить" ?
- wasyaka
- V.I.P.
-
Yandex TTS
Это не лицензионный, а дэмо-ключ для не премиум голосов
Он же используется и в сборке от ув. tonio_k
В Play_5в словарь кучу этих "территорий")))
rem правим "сёла"
F_all=Replace(F_all, " с ", " с%91 ")
F_all=Replace(F_all, " С ", " С%91 ")
Можно ж ув.chibis добавить в Play_5_filipp?
Кстати ради интереса записал книгу с помощью yndx_tts chibis голосом filipp со стартовыми настройками - быстро и без проблем...(или разов несколько разрешено?)
- olelog
- Обыватель
-
Yandex TTS
А как это сделать для "yndx_tts64" для словарей dicOMGaster и dicOMG ? Уже довольно долго "затачиваю" эти словари под Филиппа, в "yndx_tts64"
- S-a-b
- Обыватель
-
- tonio_k
- V.I.P.
-
Yandex TTS
С='с
А потом удивляться, почему правило
с руки=с рук+И
(и все остальные подобные ему) вдруг перестали срабатывать

UPD имеется в виду, что не "банально" вставить, а "правильно" и так, что бы не сломать уже имеющееся остальные правила. Точно не знаю какой механизм срабатывания правил в словаре dicOMG, но надо точно понимать как сработают такая замена с на с'
- demvi
- Интересующийся
-
Yandex TTS
Прогу надо поместить в папку с программой Play_5.hta, Запустите программу Ya64Wrap.exe.
Прога запустится с дефолтными настройками см.(Скрин1.png) и создаст файл Ya64Wrap.ini.
Порядок работы следующий: (ДМои действия)
Прилагаемый Файл "02_podg.rex" необходимо поместить в каталог "...Balabolka\dictionaries\02_podg.rex"
После запуска Балаболки, в окне словарей выбрать словарь "02_podg.rex"
Далее
1) Открываем книгу в программе Balabolka.
2) Сохраняем как текст.(Меню - Файл - Сохранить как...).
3) Открываем ранее сохранённый текст(п. 2) в Балаболке.
4) Нажимаем Ctrl+T, текст обрабатывается словарём "02_podg.rex"(если Вы его подключили), заттем выделяем весь текст по Ctrl+A?, и сохраняем его в соответствуещем файле.
5) Вот этот текст открываем в программе Balabolka, и в меню Сервис - Разбить файл на части...(Ctrl+U) разбиваем его на главы, прологи, эпилоги.
Всё.
Далее запускаем прогу "Ya64Wrap.exe", ранее помещенную в папку "yndx_tts64", рядом с "Play_5.hta" и получаем кучу удовольствия.
Чтобы не утратить оптимизма используйте размер фрагмента 3000 или менее, при больших значениях спонтанно яндекс режет хвосты аудио файлов.
Прошу отписаться тех кто рискнёт воспользоваться прогой.
Прога запустится с дефолтными настройками см.(Скрин1.png) и создаст файл Ya64Wrap.ini.
Порядок работы следующий: (ДМои действия)
Прилагаемый Файл "02_podg.rex" необходимо поместить в каталог "...Balabolka\dictionaries\02_podg.rex"
После запуска Балаболки, в окне словарей выбрать словарь "02_podg.rex"
Далее
1) Открываем книгу в программе Balabolka.
2) Сохраняем как текст.(Меню - Файл - Сохранить как...).
3) Открываем ранее сохранённый текст(п. 2) в Балаболке.
4) Нажимаем Ctrl+T, текст обрабатывается словарём "02_podg.rex"(если Вы его подключили), заттем выделяем весь текст по Ctrl+A?, и сохраняем его в соответствуещем файле.
5) Вот этот текст открываем в программе Balabolka, и в меню Сервис - Разбить файл на части...(Ctrl+U) разбиваем его на главы, прологи, эпилоги.
Всё.
Далее запускаем прогу "Ya64Wrap.exe", ранее помещенную в папку "yndx_tts64", рядом с "Play_5.hta" и получаем кучу удовольствия.
Чтобы не утратить оптимизма используйте размер фрагмента 3000 или менее, при больших значениях спонтанно яндекс режет хвосты аудио файлов.
Прошу отписаться тех кто рискнёт воспользоваться прогой.
- Вложения
-
Yanwrapper.zip
- (103.42 КБ) 34 скачивания
- S-a-b
- Обыватель
-
Yandex TTS
Я тоже не вкурсе, но речь идет не о замене всех букв "с" в книге, а о замене только предлогов, причем, этот предлог еще и не первый в предложении.
" с = с` "
Я бы поставил в числе последних к обработке.
В Play_* такие вещи были прописаны в скриптах после обработки по словарю
- olelog
- Обыватель
-
-
- Обыватель
-
Yandex TTS
Можно пойти дальше
Послушайте разные примеры:
В первую голову пришло, нужно заменить на:
к=к'
и тд, но "при 100 к' плавился" произносит также копеек.
Можно заменить на:
к='к'
Тогда копеек не говорит, уже лучше. Но это правило только если "к" стоит отдельно, если же:
"при 100к плавился" - правило не сработает.
Можно расширить правило, чтобы слева могла быть цифра, а справа либо пробел, либо знак препинания. Тогда получится захватить все сёла и копейки в:
"при 100к плавился" и тд.
Тут вопрос старостам (tonio_k, wasyaka), как это лучше сделать?
Новичкам замечу, эти и подобные правила нужно делать в конце обработки, чтобы все прочие правила, где имеются эти самые "с", "к" и тд, сработали, иначе они просто проигнорируются, например если текст будет вида:
"при 100 'к' плавился", условное правило "к плавился=к пл+авился" не сработает.

Послушайте разные примеры:
► Показать
к=к'
и тд, но "при 100 к' плавился" произносит также копеек.
Можно заменить на:
к='к'
Тогда копеек не говорит, уже лучше. Но это правило только если "к" стоит отдельно, если же:
"при 100к плавился" - правило не сработает.
Можно расширить правило, чтобы слева могла быть цифра, а справа либо пробел, либо знак препинания. Тогда получится захватить все сёла и копейки в:
"при 100к плавился" и тд.
Тут вопрос старостам (tonio_k, wasyaka), как это лучше сделать?
Новичкам замечу, эти и подобные правила нужно делать в конце обработки, чтобы все прочие правила, где имеются эти самые "с", "к" и тд, сработали, иначе они просто проигнорируются, например если текст будет вида:
"при 100 'к' плавился", условное правило "к плавился=к пл+авился" не сработает.
- S-a-b
- Обыватель
-
- wasyaka
- V.I.P.
-
Yandex TTS
Нормально, только надо указать, что аудио сохраняется в папке текста, но так даже удобней...
- olelog
- Обыватель
-
Yandex TTS
Решил проблему с " с территории" . Мушки на "с`" пробелы и прочее не помогли. Решение * с территории *= с террит+ории
- Вложения
-
- Image 002.png (87.4 КБ) 1313 просмотров
-
- Обыватель
-
Yandex TTS
Но от сёл вы не избавились, они будут преследовать вас дальше в других словосочетаниях. Вы исключили только один случай.
А еще есть копейки, рубли, метры....
Кстати, а почему мушки не помогли? Прослушал сейчас пару примеров, там все ок.
А еще есть копейки, рубли, метры....

Кстати, а почему мушки не помогли? Прослушал сейчас пару примеров, там все ок.
- sws
- Наблюдатель
-
Yandex TTS
Давно избавился от глюка Яндекса с приставкой с(село)...
Глобальным способом вводом в словарь..
с=сьь
Формат словаря ssiiaa
Глобальным способом вводом в словарь..
с=сьь
Формат словаря ssiiaa
- olelog
- Обыватель
-
Yandex TTS
В разных словарях работает по-разному возможно, я не большой спец, для себя решил вопрос для "yndx_tts64" и применяемых там словарей, поделился с другими. Если по данной проблеме у кого будут решения с "копейками, рублями, метрами, сёлами", буду рад если поделитесь )))
- Pin240
- Интересующийся
-
Yandex TTS
Обычно я переганяю текст в котором не менее 1500 кусков(файлы в txt весят более 4мв в 1252 кодировке ) и даже на одном потоке, примерно после 300-400, просто стопрится.
Не смотря на то что у меня есть демо ключ для плэй 5, он отказывается нормально с таким объемом текста работать.
Пробовал уменьшать кол-во знаков на один кусок - та же пляска. Доходит примерно до 1\4 всего текста и все.
А с мелкими (около 200 кусков по 4950 знака) текст которых примерно не более 1мв - нормуль.
Например китайску новелку Release-that-Witch Освободите-эту-Ведьму(11мв) не потянул

Даже в балоболке раз 6 пришлось, с определенного куска, включать.
Заметил особенность: wav кусков удается больше скачать чем ogg.

Перегнать в mp3 не проблема, за одно и громкость повышаю, а в некоторых голосах темп и высоту подравниваю. Если кому интересно могу написать свой скрипт
- Pin240
- Интересующийся
-
Yandex TTS
Может кому пригодится
Исходный файл wav с частатой 44100 Гц
asetrate=44100*0.9 - понизить высоту тона на 0.1
atempo=0.91 - принудительно выравнивание темпа (уменьшение на 0.9). Есть вариант atempo=sqrt(0.91) - изменение по средне квадратичному. С подбором нужно экперементировать.
-b:a 96k -codec:a libmp3lame "%%~nf".mp3 - не нуждается в пояснении
&& del "%%f".wav - удаление исходника
@color 72 - цвет в окне cmd
Выравнивание громкости. Пример также можно и на цикл адаптировать
f=200 -кол-во кадров для анализа
p=0.9 - граница пиков громкости
g=19 - параметр не обязательный, метод по гаусу (обязательно не четное число предел от 3 до 301) подробней ройте в мануале ffmpeg
-b:a 96k -codec:a libmp3lame - кодек указывать обязательно иначе вылетит ошибка
Исходный файл wav с частатой 44100 Гц
Код: Выделить всё
@echo off
@color 72
@REM сканарование wav
FOR %%f IN (*.wav) DO (
echo %%f
ffmpeg -i "%%f" -filter:a "asetrate=44100*0.9,aresample=44100,atempo=0.91" -b:a 96k -codec:a libmp3lame "%%~nf".mp3 && del "%%~nf".wav
)
@color 72
@echo Успешно
pause
atempo=0.91 - принудительно выравнивание темпа (уменьшение на 0.9). Есть вариант atempo=sqrt(0.91) - изменение по средне квадратичному. С подбором нужно экперементировать.
-b:a 96k -codec:a libmp3lame "%%~nf".mp3 - не нуждается в пояснении
&& del "%%f".wav - удаление исходника
@color 72 - цвет в окне cmd
Выравнивание громкости. Пример также можно и на цикл адаптировать
Код: Выделить всё
ffmpeg -i "0001.wav" -filter:a "dynaudnorm=f=200:p=0.9:g=19" -b:a 96k -codec:a libmp3lame 0001.mp3
p=0.9 - граница пиков громкости
g=19 - параметр не обязательный, метод по гаусу (обязательно не четное число предел от 3 до 301) подробней ройте в мануале ffmpeg
-b:a 96k -codec:a libmp3lame - кодек указывать обязательно иначе вылетит ошибка
- Pin240
- Интересующийся
-
Yandex TTS
Вылетает если добавить 1500 файлов сразу
За несколько заходов добавляет(по 400 штук)
Погонял немного,вроде работает

Куски использовал не большие. (5-10Кб)
200 кусков - полет нормальный
- demvi
- Интересующийся
-
Yandex TTS
Ну на такой экстрим я не рассчитывал. Кстати, рвать файлы на мелкие куски не обязательно, речь шла о размере фрагментов, посылаемых yndxfilipp.exe. А этот размер выставляется в Настройках. Я рву на куски книгу только из желания иметь осмысленные названия аудио файлов (01_Пролог.ogg, 02_Глава 1 и т.д.) и делю книгу в Балаболке, ибо она с этим прекрасно справляется.
- demvi
- Интересующийся
-
Yandex TTS
Добавлю следующее:
Если надо разбить книгу на файлы определенной длительности(например - 10минут), имеет смысл добавить в Ya64Wrap.exe файл полной книги, а длительность аудио файла задать числом склеиваемых *.ogg файлов. Например - размер фрагмента установлена в мои любимые 3000, это 3-3,5 минуты звучания Филиппа на скорости 1,0. Если склеивать по 3 фрагмента, то на выходе получатся файлы длительностью около 10 минут. И не надо будет закидывать в прогу по 1500 кусков. Текст книги желательно поместить в отдельную папку, так как все создаваемые файлы(аудио, логи, и обработаннй текст) будут помещены в папку Яндекс, которую прога создаст в папке с исходным текстом книги.
- Pin240
- Интересующийся
-
Yandex TTS
Это был намеренный краш тест)
Обычно я делю по 4950 символов - это чуть больше 5 минут.
Мне лично это удобно так как иногда бывает случайно зажимаю кнопки на плеере.
Позже проверю как зажует цельные большие файлы, обязательно отпишусь.
Кстате проверено. Когда длина одного аудио файла в балаболке, более 50 минут, она обрывает, даже если еще остался текст. (либо у меня не оттуда руки растут:)
А вот за то что создается отдельно подкаталог - полная уважуха) иногда этого так не хватало.
- Pin240
- Интересующийся
-
Yandex TTS
А можно расширит функционал?
Добавить запуск указанного батника после скачивания.
11мв Жует уже ночь, но только на середине(4040 фрагмента из 1 файла). Балаболка быстрей обрабатывает
- demvi
- Интересующийся
-
Yandex TTS
По поводу времени обработки это не ко мне, моя прога только и делает, что готовит тест в соответствии с настройками, скармливает его yndxfilipp.exe, а после полученные файлы переименовывает и копирует в каталог Яндекс в папке с книгой.
При одном потоке скачивания наверно и не удивительно такое время обработки.
По поводу функционала - нет, лень, да и халява может скоро кончится.
- chibis
- Обыватель
-
Yandex TTS
Я выкладывал выше вариант экзешника, который перекачивает сорвавшиеся файлы. Им надо заменить предыдущий, независимо от варианта сборки в которой он используется и от настроек.
- Lecron
- Обыватель
-
Yandex TTS
Предлагаю создать для программы отдельную ветку в разделе "Программы, использующие синтез речи в Windows", где выкладывать обновления в шапке (первом сообщении темы). Очень неудобно искать по форуму и/или следить за развитием софтины. Особенно если не читать ветку регулярно. Недавно сам оказался в ситуации olelog и тоже нуждался в вашем совете по поиску.
-
- Обыватель
-
Yandex TTS
А лучше не отдельную ветку, а прямо здесь закрепить первое сообщение, где будут все сборки для Яндекс TTS. Собственно, например как на 4пда (все уже придумано до нас).
- Fabe
- Постоялец
-
Yandex TTS
Привет
Может кто то обяснить как купить лицензионный ключ?
Дать ссылку что ли, заходил пробовал так и не понял как ..
Спасибо.
Может кто то обяснить как купить лицензионный ключ?
Дать ссылку что ли, заходил пробовал так и не понял как ..
Спасибо.
- balabolka
- V.I.P.
-
Yandex TTS
Тут нет "лицензионного ключа"; можно зарегистрироваться в "Яндекс.Облаке" и получить API-ключ для доступа к голосам "Яндекс SpeechKit". Этот ключ применяется для отправки запросов к сервису, а в ответ сервер будет возвращать звуковые файлы с речью и списывать деньги с Вашего баланса в "Яндекс.Облаке".
- Зарегистрируйтесь в Яндекс.Облаке.
- Войдите в консоль "Облака". Изначально Вам доступны 3000 виртуальных рублей для тестирования сервиса синтеза речи (прочтите в документации про пробный период). Когда закончится пробный период, надо будет пополнить баланс своими деньгами (кнопка "Пополнить баланс").
- В консоли нажмите ссылку "Перейти в текущий каталог".
- В текущем каталоге "Облака" нажмите ссылку "Сервисные аккаунты".
- Нажмите кнопку "Создать сервисный аккаунт". Выберите имя и роль (например, "admin").
- Когда сервисный аккаунт будет создан, зайдите в его свойства и нажмите ссылку "Создать новый ключ" (см. документацию). Будет предложено три варианта ключей, выберите "Создать API-ключ". Введите описание ключа (например: "Ключ для SpeechKit").
- Всё, ключ готов - идентификатор (20 символов) и сам API-ключ (40 символов). Обязательно скопируйте и сохраните эти данные на диске компьютера. API-ключ можно использовать для платного доступа к "Яндекс SpeechKit", в том числе и к премиум-голосам.
- Primkray
- Интересующийся
-
Yandex TTS
Телеграм бот использует голоса от ЦРТ (speechpro.com). Звучит очень впечатляюще.tonio_k писал(а): ↑16 дек 2020 16:46я бы рекомендовал копать в сторону телеграмм бота https://t.me/STC_TTS_bot Здесь ограничение 1000 символов, что в 2 раза больше чем на сайте
- Вложения
-
stc-cloud_tts.wav
- Голос Владимир
- (1.4 МБ) 33 скачивания