Тема: Homograph (версия 1.0)

Homograph (версия 1.0)

Автор: good_cat

mytts/download Скачать с сервера (Версия 1.0.8.256)

mytts/download Скачать с облака (Версия 1.0.8.256)

mytts/download Скачать с сервера (Версия 1.0 Linux Ubuntu 16.04 LTS 32-bit, 64-bit версии)

mytts/download Скачать с облака (Версия 1.0 Linux Ubuntu 16.04 LTS 32-bit, 64-bit версии)


mytts/exclamatoin Программа Homograph (версия 1.1)  перенесена в ветку форума Homograph


Описание:

Программа "Homograph" предназначена для поиска и замены в интерактивном режиме омографов в текстовых файлах.
Программа работает с файлами формата TXT. Поиск омографов производится по словарям омографов.


Установка и работа:

  • Программа не требует инсталляции

  • Zip-архив с программой может быть распакован в любую папку

  • Zip-архив содержит следующие файлы:

Две версии программы:
Homograph32.exe (версия программы для 32-битных операционных систем Windows)
Homograph.exe (версия программы для 64-битных операционных систем Windows)

Файлы конфигурации:
Homograph32.xml
Homograph.xml

Описание программы:
Readme.txt
Краткое руководство пользователя.pdf 


Тестовые файлы:

  • Новый помощник учителя в Пайн-Клиринге.txt (исходный файл);

  • Балаболка - Новый помощник учителя в Пайн-Клиринге.txt (обработанный программой "Балаболка");

  • # Демагог - Новый помощник учителя в Пайн-Клиринге.txt (обработанный программой "Демагог");

  • Обработанный по словарям файл - Новый помощник учителя в Пайн-Клиринге.txt (файл обработанный по Утилитам IVONA TTS для прослушивания без подключенных словарей/c отключенными словарями).

Словарь омографов (расширение *.hmg):
all_omographs.hmg - содержит более 28000 омографов.

   Подключение новых словарей производится копированием новых файлов в папку с программой  (например файла new.hmg) и выбором нового словаря из списка словарей в настройках программы.

Список_словарей_PLS.lst.

   Папка mytts_pls - словари PLS для IVONA TTS в формате X-SAMPА c сайта Искусственный голос и синтез речи .

   Папка omo_pls - выслушанные и откорректированные словари омографов с сайта Искусственный голос и синтез речи  в формате IPА.

   Пользователь сам решит нужны ли они ему и какие из них.



Предложения и замечания приветствуются.

(2017-11-17 16:30:25 отредактировано tonio_k)

Re: Homograph (версия 1.0)

Идея на доработку:
В балаболке есть такой функционал - поиск омогрофов с учетом регистра (добавляем знак $ спереди текста в списке омографов).
вот моя мысль, после обработки в балаболке текста по разным правилам  поиска и исправления омографов, где у меня заменяется беды на  бЕды или бедЫ в результате в тексте могут присутствовать все три варианта:
беды/ бЕды / бедЫ

Если произошло изменение на бЕды / бедЫ , то я в балаболке  поиске омогрофов ставлю галку с учетом регистра, а именно $беды. Тогда балаболка находит только не обработанные слова $беды , а фразы содержащие слово бЕды / бедЫ она игнорирует и не выводит в общий список.
.
Т.О. общий список омографов, которые предстоит вручную просмотреть, может ощутимо уменьшиться!


Homograph (версия 1.0) Homograph (версия 1.0)Homograph (версия 1.0)Homograph (версия 1.0)

35

Re: Homograph (версия 1.0)

Программа "Homograph" обычно используется после обработки текста программами "Балаболка" или "Демагог".
Поэтому количество омографов в списке не уменьшиться, т.к. чаще всего ищутся только необработанные омографы, а они все написаны строчными буквами (в нижнем регистре клавиатуры).

32

(2017-11-18 01:43:23 отредактировано tonio_k)

Re: Homograph (версия 1.0)

good_cat,
Может я криво что то делаю, mytts/grabli но после обработки в балаболке я открываю файл в "Homograph" и вижу, пусть и не много но все же, обработанные в балаболке слова, которые я бы не хотел видить в общем списке:

Homograph (версия 1.0)

good_cat пишет:

"Homograph" обычно используется после обработки текста программами "Балаболка"

- вы имеете ввиду, что эти слова вообще не должны находиться в "Homograph"  после обработки в балаболке?

35

Re: Homograph (версия 1.0)

tonio_k, если Вы говорите о выпадающем списке омографов, то там высвечиваются все найденные в тексте омографы. Вы думаете будет лучше, если там будут только необработанные омографы? Но когда вносятся  изменения, омографы становятся обработанными. Если их сразу удалять из списков, невозможно будет исправлять ошибки, допущенные при правке.

37

(2018-02-05 22:15:11 отредактировано zorutan)

Re: Homograph (версия 1.0)

good_cat пишет:

программа Homograph, автор good_cat

Здравия. В Вашей инструкции - "Создание аудиокниги От и До" я не разобрался  в - "ГЛАВА 5. Омографы", в которой описывается как в программе - "Homograph" обработать необработанные омографы.
Есть какое нибудь видео или подробная инструкция ?
Много чего не понятно, например написано:

"Отметим галочкой «Фильтр» и выберем «Замена - все»"

но ниже написано:

"Выбираем «умную» замену. Ставим галочку на предпочтении в жмем «Заменить»."

не могу взять в толк зачем сначала выбирать - «Замена - все» а потом "Выбираем «умную» замену? И это нужно нужно проделывать с каждым омографом ?

Добавлено: 2018-02-05 23:30:35

Вопросов столько что их все и не описать...

Пожалуйста создайте видео инструкцию с обработкой омографов любой книжки.

23

Re: Homograph (версия 1.0)

Homograph. Версия 1.1

Обновления программы в теме форума Homograph

21