Препознавање на говор на македонски (ASR)

Првите резултати во препознавањето на говор (ASR) на македонски се добиени во пионирската работа на Краљевски et al. (2000) кои го развиваат првиот систем за препознавање на цифри на македонски јазик.

Групата за говорни технологии на ФЕИТ го дава својот придонес во ова поле со систем за препознавање на говор кој работи со среден вокабулар за контрола на паметни уреди со грешка на ниво на збор (WER) од 5.48% (2013). Исто така, предложен е и систем кој работи на вгнездена платформа наменета за примена во паметен дом (2016).

Препознавање на континуиран говор

Неодамна постигнавме врвни резултати во препознавањето на континуиран говор со голем вокабулар (LVCSR). Нашиот најнов систем направен за автоматска транскрипција на медиуми на македонски постигнува импресивна рата на грешка WER од 7.73% на множество за тестирање без зборови надвор од вокабуларот, дури и во присуство на шум. Резултатите се уште повеќе охрабрувачки ако се воочат местата на кои системот прави грешки.

Во продолжение се дадени 5 искази земени од тест множеството и резултатите кои ги генерира нашиот систем. На крајот се исказите со позадински шум и бучава, кои ги дадоа најголемите рати на грешка.


UID 1113
содржина Дополнително ќе се утврди како ќе се постапува ако на последниот ден се појави нов случај.
резултат Дополнително ќе се утврди како ќе се постапува ако на последниот ден се појави нов случај.
WER 0.00%

UID 1129
содржина На овој начин здравствените власти велат дека ќе имаат поголема контрола врз ситуацијата.
резултат На овој начин здравствените власти велат дека ќе имаат поголема контрола врз ситуации.
WER 7.69%

UID 212
содржина Тие сметаат дека е потребно директно да се вклучени во борбата против насилството во училиштата.
резултат Тие сметаат дека е потребно директно да се вклучени во борба против насилството училиштата.
WER 13.33%

UID 1321
содржина Нивното присуство има позитивно влијание во нашата економија.
резултат Нивното присуство или во позитивно влијание во нашата економија.
WER 25.00%

UID 317
содржина Реално не не можеме да видиме ништо од ова.
резултат Реално не не може да видиме што од оваа.
WER 37.50%

Благодарност

Развојот на првата верзија од системот за препознавање на говор беше поддржан од проектот „САМ-ТАМ: Систем за автоматска транскрипција на медиуми” на компанијата Аналитика дооел, Скопје, Македонија, финансиран од македонскиот Фонд за иновации и технолошки развој.