logotip razpoznavalnik govora crta zgradba bralnika komunikacija z uporabnikom vhodni vmesnik uvod zgradba razpoznavalnika izhodni vmesnik priprava ustreznih strani uvod vhodna stopnja bralnika za slepe in slabovidne preko katere uporabnik posreduje svoje zelje zahteve programu je sestavljena iz dveh vzporednih procesov prvi nacin komunikacije s programom je povsem klasicen preko tipkovnice tu so nekatere tipke vnaprej programirane za opravljanje dolocenih funkcij programa slabost taksnega nacina komunikacije s programom je predvsem ta da se mora uporabnik nauciti pomenov predprogramiranih tipk pa tudi precejsnja omejenost pri dinamicnem dolocanju pomena tipk to sta bila tudi dva pomembnejsa razloga da so se razvili graficni vmesniki vendar za ljudi ki ne vidijo to predstavlja problem zato je nastala ideja da se tem ljudem omogoci komunikacija z racunalnikom z uporabo naravnega govora od programske resitve dialoga je odvisno ali bo uporabnik odgovarjal na vprasanja samo z da ne ali pa mu bo dovoljena vecja svoboda pri upravljanju vmesnika v prvem primeru postane komunikacija z dialogom zelo hitro utrujajoca in obremenjujoca kljub zelo preprostim odgovorom saj mora uporabnik odgovarjati na vsa zastavljena vprasanja in zelo hitro se zgodi da mora za neko povsem enostavno opravilo odgovoriti velikokrat v tem primeru je tudi izgradnja razpoznavalnika govora precej poenostavljena vendar pa je tak nacin komunikacije z uporabnikom neprimeren ce pa dovolimo uporabniku aktivnejso udelezbo v govornem vmesniku se moramo vprasati kje naj postavimo mejo pri taksnem komuniciranju saj bi v primeru ko bi uporabniku dovolili povsem svobodno izrazanje enako kot naravni jezik potrebovali razpoznavalnik govora ki bi vkljuceval tudi stavcno in pomensko analizo besedila kar pa je precej obsezna naloga zgradba razpoznavalnika govora sam razpoznavalnik uporabljen v prvih poizkusih je bil razvit v laboratoriju za umetno zaznavanje in omogoca razpoznavanje stalnega izbora loceno izgovorjenih ukazov sistem za razpoznavaje govora je sestavljen iz vec podsistemov glej sliko vhodni modul detektor govora skrbi za neprekinjeno zajemanje akusticnega signala iz mikrofona in filtriranje vhodnega signala ter detekcijo govora v modul za dolocanje znacilk vstopajo izseki vhodnega signala ki vsebujejo govor ukaze ki jih je uporabnik izrekel na tej stopnji se iz zaporedja vzorcev signala dolocijo znacilke za posamezne odseke signala s homomorfno analizo tako dobimo parametre prevajalne funkcije ki so kvantitativnega znacaja in jih uredimo v vektor znacilk tem parametrom dodamo se moc izseka govornega signala in frekvenco osnovnega tona zvenecih glasov naslednji modul je kvantizacija vektorjev znacilk vsak izsek govornega signala predstavimo z vektorjem znacilk vendar pa beseda lahko traja vec izsekov in zato dobimo vec vektorjev govorec tezko ponovno izgovori besedo na povsem enak nacin razlicne govorci pa to isto besedo lahko izgovorijo povsem drugace to pomeni da moramo imeti za eno besedo vec vzorcev zato da bi bila naslednja stopnja preprostejsa predvsem pa da bi zmanjsali racunsko zahtevnost vektorje znacilk kvantiziramo razdelimo v razrede in vsakemu vektorju iz razreda priredimo enak vektor znacilk cite pavesic izhodni del razpoznavalnika govora temelji na diskretnih prikritih markovovih modelih pmm vzorec razvrstimo s pmm tako da poiscemo najbolj verjetno zaporedje stanj oziroma najbolj optimalno pot ki jo je model naredil da je ustvaril doloceni niz zgradba razpoznavalnika govora slika zgradba razpoznavalnika govora razpoznavalnik dovoljuje prenos razpoznanih ukazov preko omrezja tudi interneta po nacelu odjemalec streznik v odjemalcu tece celotna aplikacija bralnik za slepe od razpoznavalnika govora pa se tu izvrsijo prve tri stopnje razpoznavanja govora medtem ko zadnja stopnja torej iskanje najverjetnejse poti po prikritih markovovih modelih ki je procesorsko najzahtevnejsa tece v strezniku komunikacija poteka po protokolu tcp ip tako smo omogocili da za odjemalec lahko uporabimo zelo preprost racunalnik dx mb ram hkrati pa zelo preprosto nadgradnjo in razvoj razpoznavalnika zato da bi bil promet po omrezju cim manjsi smo vse korake vkljucno s kvantizacijo vektorjev znacilk izvrsili ze v odjemalcu in se tako prenasajo samo vektorji znacilk dolzine nekaj deset bajtov projekt kiklop kiklop luz fe uni lj si laboratorij za umetno zaznavanje Šavtor drago radin oktober