Првите резултати во препознавањето на говор (ASR) на македонски се добиени во пионирската работа на Краљевски et al. (2000) кои го развиваат првиот систем за препознавање на цифри на македонски јазик.
Групата за говорни технологии на ФЕИТ го дава својот придонес во ова поле со систем за препознавање на говор кој работи со среден вокабулар за контрола на паметни уреди со грешка на ниво на збор (WER) од 5.48% (2013). Исто така, предложен е и систем кој работи на вгнездена платформа наменета за примена во паметен дом (2016).
Неодамна постигнавме врвни резултати во препознавањето на континуиран говор со голем вокабулар (LVCSR). Нашиот најнов систем направен за автоматска транскрипција на медиуми на македонски постигнува импресивна рата на грешка WER од 7.73% на множество за тестирање без зборови надвор од вокабуларот, дури и во присуство на шум. Резултатите се уште повеќе охрабрувачки ако се воочат местата на кои системот прави грешки.
Во продолжение се дадени 5 искази земени од тест множеството и резултатите кои ги генерира нашиот систем. На крајот се исказите со позадински шум и бучава, кои ги дадоа најголемите рати на грешка.
UID | 1113 |
---|---|
содржина | Дополнително ќе се утврди како ќе се постапува ако на последниот ден се појави нов случај. |
резултат | Дополнително ќе се утврди како ќе се постапува ако на последниот ден се појави нов случај. |
WER | 0.00% |
UID | 1129 |
---|---|
содржина | На овој начин здравствените власти велат дека ќе имаат поголема контрола врз ситуацијата. |
резултат | На овој начин здравствените власти велат дека ќе имаат поголема контрола врз ситуации. |
WER | 7.69% |
UID | 212 |
---|---|
содржина | Тие сметаат дека е потребно директно да се вклучени во борбата против насилството во училиштата. |
резултат | Тие сметаат дека е потребно директно да се вклучени во борба против насилството — училиштата. |
WER | 13.33% |
UID | 1321 |
---|---|
содржина | Нивното присуство има позитивно влијание во нашата економија. |
резултат | Нивното присуство или во позитивно влијание во нашата економија. |
WER | 25.00% |
UID | 317 |
---|---|
содржина | Реално не не можеме да видиме ништо од ова. |
резултат | Реално не не може да видиме што од оваа. |
WER | 37.50% |
Развојот на првата верзија од системот за препознавање на говор беше поддржан од проектот „САМ-ТАМ: Систем за автоматска транскрипција на медиуми” на компанијата Аналитика дооел, Скопје, Македонија, финансиран од македонскиот Фонд за иновации и технолошки развој.