събота, 22 ноември 2014 г.

SpeechLab: Добавяне на модифициран и вече компилиран потребителски речник

От няколко дни и аз вече съм притежател на, и използвам, SpeechLab за Android. Трябва да призная, че като цяло съм доволен от речевия синтезатор. Бях скептичен относно пъргавостта му, но се оказа че е доста по-добре, отколкото очаквах. А и качеството на гласа надвишава в пъти това на българския глас в eSpeak.

Но в гласа „Гергана“ от продукта SpeechLab, дори във версията му за Windows, има някои неща, които ме дразнят. Главното от тях е неправилното произношение на някои английски думи (главно – термини и съкращения). Примери за такива са: Bluetooth, USB, Wi-Fi, Skype и др. За щастие обаче, SpeechLab има възможност да използва т.нар. „потребителски речник“. Този потребителски речник ни позволява да въведем даден низ (дума, термин, съкращение, абревиатура и т.н.) и да инструктираме как този низ да бъде прочитан от речевия синтезатор.

Аз реших да се позанимавам малко с този потребителски речник и да добавя в него тези най-често срещани и дразнещи ме думи и да въведа за тях правила за правилното им произнасяне от „Гергана“. В помощната документация на SpeechLab е описано как се работи с потребителския речник под Windows (добавяне и редактиране на думи, компилиране, и т.н.), тъй че на тази процедура няма да се спирам. Тук само ще ви обясня как да си добавите вече приготвения от мен речник във вашето копие на SpeechLab (под windows и Android).

За да добавите вече приготвен потребителски речник във инсталирано на вашия компютър копие на SpeechLab за Windows, правите следното:

  1. Изтегляте ZIP архива от линка по-долу
  2. Разархивирате изтегления ZIP архив с разархивираща програма по ваш избор
  3. Двата файла („custom.dic“ и „customdic.sqt“) от разархивираната папка „SpeechLab“, ги копирате в папката „customdic“ в програмната папка на SpeechLab за Windows и потвърждавате заместването на вече съществуващите файлове там с копираните от вас. Пълният път до папката на SpeechLab под windows, където трябва да поставите файловете, обикновено се намира в следната директория: „\Program Files\BACL\SpeechLab\customdic\“ (за 32-битови версии на операционната система и в „\Program Files (x86)\BACL\SpeechLab\customdic\“ (за 64-битови версии на операционната система). ВНИМАНИЕ! Преди да заместите оригиналните файлове с модифицираните такива, направете копие на двата файла („custom.dic“ и „customdic.sqt“) от програмната папка на SpeechLab на безопасно място, за да можете да ги възстановите при евентуален проблем с модифицираните такива!
  4. Ако вече не сте го направили, трябва да си създадете нов профил за настройки в конфигуратора на SpeechLab и в този нов профил да включите опцията за използване на потребителския речник. Как става това, можете да прочетете в помощната документация на SpeechLab за Windows
  5. След като изпълните гореописаната процедура, ще е добре да рестартирате всички приложения, които в момента използват SpeechLab (например екранния четец, Balabolka, SkypeTalking и др. под.). Това се прави, за да се презаредят модулите на синтезатора и направените промени да влязат в сила

За да добавите вече приготвен потребителски речник във инсталирано на вашето устройство с операционна система Android копие на SpeechLab, правите следното:

  1. Изтегляте ZIP архива от линка по-долу
  2. Разархивирате изтегления ZIP архив с разархивираща програма по ваш избор
  3. Прехвърляте файла „customdic.sqt“ от разархивираната папка „SpeechLab“ в папката със служебните файлове на SpeechLab във вашето устройство. Тази папка обикновено се намира в главната (кореновата) директория или във вътрешната памет на устройството, или в SD картата. Потвърждавате заместването на вече съществуващия там файл с модифицирания такъв. ВНИМАНИЕ! Преди да заместите оригиналния файл с модифицирания такъв, направете копие на файла „customdic.sqt“ от служебната папка на SpeechLab във вашето устройство на безопасно място, за да можете да го възстановите при евентуален проблем с модифицирания такъв!
  4. След това отидете в Приложения -> Настройки -> Настройки SpeechLab и в отворилия се прозорец сложете отметка на опцията „Потребителски речник“
  5. След това отидете в прозореца с настройки на системата, където се променя (задава) речевата машина по подразбиране в Android, временно превключете на друга речева машина и след това превключете обратно на „SpeechLab 2.0“ – това кара системата да презареди модулите на текущата речева машина. Така направените промени (в случая – заменения речник) влизат в сила

ЗАБЕЛЕЖКИ

  1. Помощната документация на SpeechLab за Windows се отваря от меню „Старт“ -> Всички програми -> BACL SpeechLab 2.0 -> Help
  2. Файлът „custom.dic“ е обикновен текстов файл с кодировка UTF-8 и в него се описват (добавят) думите за потребителския речник. Към текущия момент той се използва само под Windows, затова копирането му в папката на SpeechLab под Android не е необходимо
  3. Тези инструкции са включени и в самия архив

Добавените от мен в този модифициран речник низове са: „персонализиране“, „Skype“, „Канарите“ (с ударение върху второто „а“ вместо върху „и“, в чест на моя любим оркестър за народна музика – „Канарите“), „USB“, „Bluetooth“, „Wi-Fi“, „online“, „ofline“, „offline“, „Google“, и др. В речника я има и вкараната по подразбиране в него абревиатура „БАКЛ“, която означава „Българска асоциация за компютърна лингвистика“ (това са създателите на продукта SpeechLab).

А ето и линк за изтегляне на гореспоменатия архив с модифицирания от мен потребителски речник:

Това е. Дано да съм ви бил полезен. Приятна работа със SpeechLab!