racunalnisko razumevanje slovenskega jezika aplikativen projekt mzt sofinanciranje copernicus projekt multext east projektna skupina mednarodno sodelovanje delo in rezultati povzetek podrobnejsi prikaz rezultatov publikacije povzetki vmesnih porocil sofinanciranje copernicus projekt multext east multilingual text corpora for eastern and central european languages v katerem sodelujeta dva zahodno evropska in sest vzhodno evropskih partnerjev s pridobitvijo sofinanciranja se je projekt delno preusmeril v aplikativne raziskave osnovnih racunalniskih virov slovenskega jezika in podaljsal za eno leto projektna skupina clani skupine za jezikovne in govorne tehnologije odseka za inteligentne sisteme ijs dr damjan bojadziev odgovorni nosilec dr peter tancig ddr dr tomaz erjavec m sc dr france dacar mag ales dobnikar mr dipl ing tomaz sef mr prvotno projektno skupino so zapustili stirje mladi raziskovalci vecinoma po zakljucku magisterija trije l in eden l ter dva druga raziskovalca delno povezana s projektom mednarodno sodelovanje poleg projekta multext east sofinanciranje v katerem je dr erjavec vodil delovni paket workpackage wp tool application to corpora in organiziral delovno srecanje projekta l v ljubljani se dva evropska projekta copernicus concerted action telri trans european language resources infrastructure kjer je dr erjavec koordiniral working group lingware availability performance assessment in cost prosodics of synthetic speech projektna skupina je organizirala delovno srecanje tega projekta l na bledu pomembno je predvsem sodelovanje v projektu multext east ki prenasa jezikovne tehnologije in vire resources razvite za zahodno evropske jezike na vzhodno evropskih jezikov rezultati tega sodelovanja so nastajajoce delno tudi paralelne zbirke jezikovnih podatkov za te jezike s pripadajocimi leksikoni in orodji za obdelavo zbirk sodelovanje v drugih dveh mednarodnih projektih poteka bolj na nivoju izmenjave znanj in izkusenj in dosti manj na nivoju izdelovanja skupnih produktov delo in rezultati najvec dela je bilo opravljenega na formalnem modeliranju morfo sintakticnega nivoja slovenskega jezika z uporabo formalizma hpsg head driven phrase structure grammar in sicer na modeliranju strukture stavka in morfologije glagolov ti modeli so bili tudi implementirani v prologu in vkljuceni kot del ali razsiritev sistemov za obravnavanje jezika razvitih v tujini namesto bolj celovite integracije teh modelov tudi z nastajajocim sistemom za difonsko sintezo slovenskega govora je bil v drugi polovici projektnega obdobja poudarek na razvoju racunalniske zbirke jezikovnih podatkov za slovenski jezik v okviru projekta multext east poleg tega osnovnega dela na racunalniskem razumevanju slovenskega jezika je bilo opravljenega se nekaj dela na formalnih sistemih ki niso povezani le z jezikom relacijski sistemi oz omrezja pogojev nekateri aspekti samo nanasanja v formalnih in delno naravnih jezikih ali le s slovenskim jezikom tudi strukture japonskega delno se angleskega jezika ter nekaj raziskav racunalniske glasbe formalizacija in avtomatsko dolocevanje kontrapunkta in harmonije podrobnejsi prikaz rezultatov prenos v prakso sodelovanje z amebis d o o pri izdelavi racunalniskih virov slovenskega jezika v okviru multext east transfer jezikovnih tehnologij multext multext east amebis povzetki vmesnih porocil