Тема: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

В этой теме обсуждаем всё связанное со словарями

23

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Выложенные Вами Словари *.rex, *.dic для программ "Balabolka" и ''Demagog" подходят для только голоса Алёна или для голосов Максим и Татьяна тоже? Спрашиваю оттого, что в названиях словарей стоит имя Алёна (alyona):

5_R_E_1_OMOGRAPF_alyona.dic   и т.д.

29

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

skreb пишет:

Выложенные Вами Словари *.rex, *.dic для программ "Balabolka" и ''Demagog" подходят для только голоса Алёна или для голосов Максим и Татьяна тоже?

Расстановка ударений в текстах для этих голосов одинаковое - прописной (заглавной) гласной буквой.
Поэтому можно использовать без сомнений.

27

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

mytts_omograph_1.pls------> Август=ˈavɡʊst
mytts_omo_auto.pls--------->август=ˈavɡʊst
а почему не так?

Словари для IVONA TTS 1.6.75. Обсуждение, предложения



И по 2_corector_ivona_ru
Переводит всё заглавное в нижний регистр, что не оченб удобно,
с учётом того что Максим слово читает одинаково, хоть все в верхнем регистре.
фраза красивая Машина машина
фрагмент
@([А-яЁё]) \bМашина\b=$1 мАшинаЪ
@([А-яЁё])\, \bМашина\b=$1, мАшинаЪ
@([А-яЁё]) \- \bМашина\b=$1 - мАшинаЪ
@([А-яЁё])\, \- \bМашина\b=$1, - мАшинаЪ
@)([А-яЁё]) \bмашина\b=$1 машИнаЪ
@([А-яЁё])\, \bмашина\b=$1, машИнаЪ
@([А-яЁё]) \- \bмашина\b=$1 - машИнаЪ
@([А-яЁё])\, \- \bмашина\b=$1, - машИнаЪ
@\bМашина\b=машина
+ в самом последнем
$мАшаЪ=мАша
$машАЪ=машА
красивая мАшина машИна
и т. д
А этих машин бывает в тексте...

20

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka пишет:

2_corector_ivona_ru  Переводит всё заглавное в нижний регистр, что не оченб удобно

wasyaka, "Homograph" ищет омографы по заглавным буквам в словах, поэтому 2_corector_ivona_ru.rex всё переводит в строчные буквы, и дальше идет поиск омографов программой Demagog или Вalabolka и расстановка ударений в найденных омографах.

У меня возникает вопрос: Вы читали документацию программы "Homograph" и "Создание аудиокниги От и До" в теме о которых задаёте вопрос?

25

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka пишет:

mytts_omograph_1.pls------> Август=ˈavɡʊst
mytts_omo_auto.pls--------->август=ˈavɡʊst

То что Вы приводите на картинке относится IVONA TTS версия 1.6.74 и младше.

IVONA TTS 1.6.75 не умеет работать с словарями PLS, хотя может озвучивать фонемы. Колонки "grapheme2" и "grapheme3" для неё бесполезны.

Танцы с бубнами не предлагать! Обычному пользователю они не нужны.

Словарь mytts_omo_auto.pls предназначен для "пропущенных" омографов. Об этом написано в описании словарей.

25

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Простите, может, за банальный вопрос. Существует ряд словарей Dic, Rex, Pls, Hmg. Для полноты понимания, объясните, пожалуйста, просто (как для чайника), их назначение, применение, все ли они нужны для озвучки, допустим, Максимом в «Балаболке».

22

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

skreb пишет:

Простите, может, за банальный вопрос. Существует ряд словарей Dic, Rex, Pls, Hmg. Для полноты понимания, объясните, пожалуйста, просто (как для чайника), их назначение, применение, все ли они нужны для озвучки, допустим, Максимом в «Балаболке».

Файлы Hmg - это файлы со списком омографов и правилами расстановки ударений.
Пример фрагмента словаря

спешил=спЕшил,спешИл
спешила=спЕшила,спешИла
спешили=спЕшили,спешИли
спешило=спЕшило,спешИло
спешим=спЕшим,спешИм
спешит=спЕшит,спешИт
спешите=спЕшите,спешИте
спешить=спЕшить,спешИть
спешишь=спЕшишь,спешИшь
спешу=спЕшу,спешУ

  По этим словарям обрабатываются омографы в тексте, в частности, программой "Homograph". Они могут быть разные по наполняемости.

Файлы Pls - это словари для синтезатора  речи IVONA TTS. В них содержатся правила озвучивания записанных в них слов. С помощью этих словарей корректируется произношение слов.

О словарях Dic, Rex почитайте в теме диалоги с автором программы "Demagog", я лучше не смогу обьяснить. В этой же теме есть ссылка на ответ автора программы "Balabolka".

Если будут вопросы потом зададите.

26

(2017-11-26 20:43:02 отредактировано flegont)

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

skreb пишет:

Простите, может, за банальный вопрос. Существует ряд словарей Dic, Rex, Pls, Hmg. Для полноты понимания, объясните, пожалуйста, просто (как для чайника), их назначение, применение, все ли они нужны для озвучки, допустим, Максимом в «Балаболке».

Для начала, попробуйте просто послушать, как читает Максим вообще без словарей. Вполне вразумительно.

У меня, к примеру, Максим версии 74 и (до последнего времени) ни одного подключенного словаря. Ни пресловутых PLS, ни rex, ни dic. Да, Максим иногда делает ошибки в ударениях и, изредка, читает в слове букву "е" там, где подразумевается "ё". Где-то так 3-4 ошибочки на страницу.
Через некоторое время, когда красота голоса (а он, довольно качественный, смею заметить) уже не будет так изумлять и восхищать, некоторые постоянные ошибки уже начнут слегка раздражать. Или даже не слегка... Вот тогда и наступит время подумать о подключении словарей.

Тут главное - без фанатизма!

"Исправлять надо лишь то, что раздражает" (с) В. Шойтов-Харитановский - автор программы MP3book2005

Лично я, кроме словаря-ёфикатора, расставляющего букву "ё" вместо "е" везде, где она точно должна быть, пользуюсь еще словарем омографов, чтобы вручную разобраться с омографом "все/всё". Он - самый нервирующий, на мой взгляд. И - самый частый, около 50% случаев.

Итак:
1) словарь-ёфикатор
2) словарь омографов для ручной правки вот этой бандитской десятки Ё-омографов: все перед всем слезы села небо чем-то жены сестры берег

Осталось рассказать, как я борюсь с ошибками ударения Максима. Тут я - кустарь-одиночка  mytts/ab Никого, конечно, не призываю следовать своему примеру. "Вид у вошедшего был восхитительно и безупречно деревенский" (с) Это, наверное, про меня сказано  mytts/ag Есть у меня маленький словарик Maxim-ipa.dic, который постепенно пополняется. Для предъявления на всеобщее обозрение он пока не готов.
Но принцип его - тот же, что описан good_cat в руководстве по созданию аудиокниг: вставка управляющего тега прямо в текст. Например, Максим упорно читает: в своей дУше вместо в своей душЕ Исправляется это добавлением в мой словарик вот такого правила:
*ей душе=ей <phoneme alphabet="ipa" ph="dʊʂˈe"/>

И т.д. и т.п.

В общем, повторю еще раз: не надо торопиться сразу подключать любой словарь, подвернувшийся под руку.
"Лучше ничего не делать, чем сделать что-нибудь не так" (с) Лайф-хак от легионеров Римской империи  mytts/dn

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

good_cat пишет:

У меня возникает вопрос: Вы читали документацию программы "Homograph" и "Создание аудиокниги От и До" в теме о которых задаёте вопрос?

@\bМашина\b=машина переводит омограф в нижний регистр
И так по всем ...счемто тысяч. все омографы в нижнем регистре (80 (больше пока не встретилось - 12000 ещё за три года не разу не попались, и не факт, что встретятся.) из них с функциями  расстановки автоматом. за исключением если омографом начинается предложение).
Но вначале если есть совпадения(см. выше) проставит ударение mytts/cj  или Вам нравится всё ручками? mytts/hammerdrill
Здесь полный файл


И по именам.
программа "Homograph" ищет имена, Прослушаем звучание слов, нажав на кнопку «Воспроизведение» на медиаплеере в
левом нижнем углу
. а если они правильно звучат и их нету в pls? безконца слушать заново? а остальные слова? - Искать в Балаболке, тогда  и заодно и имена и сохранить ранее прослушанные... или согласиться с ошибками? (в 1.6.74 в среднем 10 слов на час прослушки) при скорости 0. Не думаючто в 75 этот показатель  лучше.

Добавлено: 2017-11-26 21:37:02

flegont пишет:

*ей душе=ей <phoneme alphabet="ipa" ph="dʊʂˈe"/>

А с ней в  дУше не купались? mytts/ag
Ну и за одно вопрос: А ваша прога имеет функцию поиск новых слов?

Добавлено: 2017-11-26 22:11:38

flegont пишет:

Вот тогда и наступит время подумать о подключении словарей.
Тут главное - без фанатизма!

Согласен. Моё мнение - словарей должно быть тригруппы
1 _исправление типографии (компьютерные технологии до издательств не дошли и с буквой Ё они не знакомы(все-всё и е=ё)
2 -начальная подготовка текста (corector)
3- Числа (если flegont-а раздражают ёки, то меня неправильно произнесённые цифры mytts/dx )и омографы(добавлять только те, которые  часто встречаются (дома, города и т. д.) и имеют возможность повтора, а также все с предлогами(на.по.от и т.д. ) и не более трёх слов - больше вероятность повтора около нуля.  Все остальные - "Homograph" в помощ.
OMOGRAPF_alyona.dic - в каждом (почти) 50 000 раз выламывают, переламывают (и ещё какими то способами) дужку замка - всем в смысле тебе, мне, нам, ему, ей... Зато много... mytts/be
PS по мАшинаЪ и мАшинаЪ
Ъ для исключения повторной обработки словарями

21

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Ваша ссылка на файл, не открывается, поправьте.

wasyaka пишет:

программа "Homograph" ищет имена, Прослушаем звучание слов, нажав на кнопку «Воспроизведение» на медиаплеере в левом нижнем углу.

Чем Вас "Homograph" обидел? В этой программе нет медиаплейера, не вводите читателей в заблуждение.

Если есть замечания по програмaм "Нomograph" и "OpenPLS" - пишите в соответствующие темы, здесь это    mytts/offtopic. Отвечать здесь на такие сообщения не буду.

25

(2017-11-26 23:26:40 отредактировано flegont)

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka пишет:

Ну и за одно вопрос: А ваша прога имеет функцию поиск новых слов?

Это - составление алфавитно-сортированного списка всех слов в тексте и прослушивание их по одному? Что-то такое было в MP3book2005.

Мне эта идея не особенно близка. Потому я и не стал добавлять ничего такого в свою программу. Ведь слово может нормально звучать, как одиночное, но искаженно - в контексте. И прослушивание отдельно в списке - не позволит выявить ошибку - надо слушать весть текст.

А вот, чтобы услышав по ходу чтения ошибку, остановиться и, отметив нужный фрагмент, сразу отправить в заданный словарь для добавления нового правила - над этим стОит подумать...

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

flegont пишет:

Итак:
1) словарь-ёфикатор
2) словарь омографов для ручной правки вот этой бандитской десятки Ё-омографов: все перед всем слезы села небо чем-то жены сестры берег

К сожалению, у любой палки 2 концa.

Ivona TTS Ё-фицированные слова тоже не все правильно читает.

И уходя от словаря Е-Ё, и избегая проблем c выставлением ударения, ибо Ё - всегда ударная гласная,
мы приходим к словарю

<слово с Ё>=<phoneme alphabet="ipa" ph="@@@@"/>.

Но радует, что таких слов значительно меньше.  mytts/ab

25

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

ССылку поправил

программа "Homograph" ищет имена, Прослушаем звучание слов, нажав на кнопку «Воспроизведение» на медиаплеере в левом нижнем углу.

Это из инструкции:


3. Имена собственные, да те, которые пишутся с прописной буквы. Авторы иногда
такого придумают или ударение не там будет ставится и это будет терзать уши. Есл
есть время и желание надо искать и проверять.
Ищем… Меню Утилиты → Список названий, имен и аббревиатур. И сохраняем


ГЛАВА 6. Возвращаемся к именам собственным.
Ранее мы сохранили имена собственные из программы в файле имена.txt.
И хотели проверить их на правильность звучания.
Запускаем программу «OpenPLS».
Выбираем меню Импорт.Экспорт → Импорт из файла TXT.
Открываем наш файл.
Укадываем мышью на строку «grapheme» в левой части таблицы
Затем на заголовок столбца «Field1» в правой части, связывая их между собой.И
подтверждаем импорт данных.
Получаем
Переводим все слова в строчные буквы, нажимая <ALT-Пробел>
И запускаем «Проверку дубликатов в словарях», нажимая <F9> или из меню.
Из 49 слов 5 дубликатов.
Выберем фильтр «повторные слова» и удалим их
Снимем фильтр «Повторные слова» и сохраним файл «Newfile.pls».
Прослушаем звучание слов, нажав на кнопку «Воспроизведение» на медиаплеере в
левом нижнем углу.

Выделим с помощью <CTRL+Левая кнопка мыши> неправильно звучащие слова и
удалим непомеченные записи.

20

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka, Вы не понимаете о чём я говорю? Или делаете вид, что не понимаете.

Вы взяли текст. Вырезали из него 2 фразы из разных глав, и соединили их:

wasyaka пишет:

программа "Homograph" ищет имена, Прослушаем звучание слов, нажав на кнопку «Воспроизведение» на медиаплеере в левом нижнем углу.

Соединив фразу из главы с "Ноmograph", с фразой из главы с "OpenPLS".
Заменив при этом  "Ищем..." на "ищет,". Смысл моментально поменялся коренным образом.

Человек который не знаком с исходным документом поймет, что в программе "Homograph" есть медиаплеер.
На что Вам и было указано:

good_cat пишет:

Чем Вас "Homograph" обидел? В этой программе нет медиаплейера, не вводите читателей в заблуждение.

с предложением не торопиться при написании ответов.

Просьба избегать избыточного цитирования.

24

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka пишет:

flegont пишет:
*ей душе=ей <phoneme alphabet="ipa" ph="dʊʂˈe"/>
А с ней в  дУше не купались?

ну, можно и вот так  mytts/bqa :

в *й душе=в й <phoneme alphabet="ipa" ph="dʊʂˈe"/>

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

good_cat пишет:

wasyaka, Вы не понимаете о чём я говорю? Или делаете вид, что не понимаете.
Вы взяли текст. Вырезали из него 2 фразы из разных глав, и соединили их:

И солько между ними?
Проехали, как говорится в чужой монастырь со своим...

23

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka, в конце концов! Пользуйтесь предварительным просмотром! Шарады какие-то.
Что сказать хотели? Донесите смысл пояснее.

22

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Вы выложили свой метод: цитата: (Ранее мы сохранили имена собственные из программы в файле имена.txt. И хотели проверить их на правильность звучания.)
...В OpenPLS проверили имена на наличие дубликатов  и прослушали на правильность произношения.
Я хотел уэнать: а что дальше?  В смысле как поступаете Вы. В следующей книге прослушиваете опять, те которые правильные и были ранее прослушаны, но отсутствуют в pls? ну и просто слова они тоже имеют свойство произносится с искажениями и как быть с ними?
Мне ответ не нужен, но  но те которые прочитав инструкцию, взялись  готовить книгу а там более 500 имён (Бушков, последние из цикла о Свароге ). всё, желание пропало.
Я выложил  на  ветке Кообаудио - прога не популярная, не кто не заходит.
Попробую ещё другой вариант. благо наэксперементировался за три года... можкт кому поможет... могу вообще  mytts/russian

26

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka, Вы зря обижаетесь, у Вас много хороших наработок.

Поймите Вы меня, наконец, не учат первоклашек высшей математике.

Пользователь взял с сайта производителя дистрибутив IVONA TTS версии 1.6.75.

Вот про это и идет речь, как собрав все компоненты указанные в методике - он и получит аудиокнигу,
с тем минимальным набором которые к ней уже прилагаются. И вряд ли его первой аудиокнигой окажется
последняя книжка про Сварога с 500 личными именами.

А вот когда у него всё заработает, и он послушав, не выкинет всё в корзину Windows, он начнет
искать словари. И наткнется на Ваши -  словарь личных имен, и словари неправильно звучащих слов, и
возьмет их для использования в качестве пользовательских словарей, и скажет  mytts/thank_you

22

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

wasyaka пишет:

Я хотел уэнать: а что дальше?  В смысле как поступаете Вы. В следующей книге прослушиваете опять, те которые правильные и были ранее прослушаны, но отсутствуют в pls? ну и просто слова они тоже имеют...



Есть словарь личных имен и географических названий, словарь Maxim, куда складываю пополнения с Ваших словарей, "мой словарь", словарь с родственных сайтов, словарь омографов, и. т д и т п.

Личные имена выбираются, новинки просматриваются - экзотика (типа Бушкова)   - выслушивается. После прочтения книги - все словари пополняются. пополняется не одним словом, а всем семейством "нехороших слов" Слушаю всё  в mp3, чтобы никому не мешать.

Вопрос о прослушивании имен собственных - вопрос из категории "стакан наполовину полон, или стакан наполовину пуст". Вы ведь тоже выслушиваете их, а вопрос когда потратить  на них 15 минут времени до начала обработки  или после нее - это вопрос риторический. А кому-то будет всё равно - как звучат имена
Атос или атОс, пАртос или портОс.

25

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Хочу поделиться такой своей находкой

в файле 2_corector_ivona_ru.rex - из mytts_dic_rex.zip
п. 12.4. "Коррекция букв в словах кроме аббревиатур". Оно делает все слова в книге с маленькой буквы.

Если это правило сработает в самом начале обработки текста, то все правила типа: $И все?=И всЁ? не будут работать так как они привязаны к регистру. Если его запустить в самом конце, то правила типа вдоль облака=вдоль Облака потеряют смысл, так как всё опять заменится на облака.

Выход из ситуации я для себя нашел такой:

Сначала содержимое п. 12.4. в файле 2_corector_ivona_ru.rex надо заремарить или удалить ( только правила с буквами русского алфавита) иначе дальнейшее не имеет смысла.

Теперь создадим 3 файла mytts/ds


1) Постобработка резервируем омографы с ударением на 1 букву.DIC 

одна из строк файла:
$Облака=zfkrfdgkzl1138
где каждому омографу я присваиваю уникальный код.
В файле собраны ВСЕ Омографы, у которых ударение падает на первую букву.
я их вытащил из файла all_omographs.hmg - тот что идет с программой Homograph.

2) Постобработка смена регистра.REX
это скопированный п. 12.4.
одна из строк файла:
@\b[О]([^А-ЯЁ\d]+)=о$1
меняем на нижний регистр все первые буквы слов в тексте

3) Постобработка восстановление омографы с ударением на 1 букву.DIC
тут делаем обратную операцию к п. 1
одна из строк файла:
zfkrfdgkzl1138=Облако

Теперь запускаем их строго друг за другом по порядку в самом конце обработки книги.
т.е. не кидаем скопом в папку со словарями, а именно сначала получаем текст по первому правилу, и полученный текст обрабатываем следующим правилом. Так как 2 по порядку это REX словарь.

Альтернатива - тогда можно будет, действительно, кинуть все в одну папку со словарями и поставить галочку напротив.  Тогда балаболка / демагог сделает разом, это если второй файл будет .DIC а правила в нем будут типа $О*=о, но тогда у вас могут абривиатуры поплыть типа сССР или бАМ

Вот и всё.  Все слова будут в маленькой буквы, а нужные нам омографы, с ударением на первую букву, - останутся без изменений.

Добавлено: 2017-12-16 10:30:35

у кого возникает проблема с "быстрым проговариванием без паузы на одном дыхании" оглавление текста в начале книги типа:
Роман Злотников
ШАГ К ЗВЕЗДАМ
Пролог
Блаблабла....конец книги.

в 2_corector_ivona_ru.rex нужно добавить строчку
([A-Za-zА-яЁё]|\,)(\r)(\n)=$1<silence msec="500"/>

24

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Помогите пожалуйста:
как подключить PLS словари к Максиму 1.6.75 или уже 1.6.76?
Через OpenPLS или PLShelper пробовал, никакого видимого слышаемого эффекта.
пОтом по еще одному делу
уже не могу слышать...
Пробовал руками в реестре прописывать как для <1.6.74, тот же результат.
На данный момент никакие танцы с бубном  mytts/hid  не помогли, где-то откопал 1.6.72, слушаю с ней.
Спасибо заранее.
З.Ы.: огромная просьба ко всем кто выкладывает словари: используйте UTF-8 кодировку

20

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

skyfox пишет:

На данный момент никакие танцы с бубном    не помогли, где-то откопал 1.6.72,

Maxim(1.6.74) начальная версия с возможностью использованимя OpenPLS или PLShelper
Чуть ниже "шапочной" версии:

20

Re: Словари для IVONA TTS 1.6.75. Обсуждение, предложения

Подскажите, где и что надо исправить , чтобы синтезатор IVONA
Татьяна произносила сокращения корректно, т.е. как написано. Сейчас она следующие
сокращения читает так: 2005 г. - 2005 грамм ; ...(некое перечисление) и пр. - ... и проспект ;
Ап. Павел - апатиты Павел ;"в... - восточной долготы ;стр. 253 - строение 253...
IVONA Татьяна "чистая", самостоятельно словари не устанавливал.

14