uro kufca republika slovenija center vlade za informatiko langusova ljubljana slovenija uros skufca gov si uporaba tezavra eurovoc v informacijskih sistemih izvlecek omreje internet danes predstavlja neobvladljivo mnoico neurejenih podatkov zato je dandanes teko najti prav informacijo ki jo icemo v ta namen so na omreju internet postavljeni posebni streniki ki noc in dan indeksirajo razlicne strenike na omreju internet in jih razvrcajo v svoje podatkovne baze glede na kljucne besede ki se pojavljajo v posameznih dokumentih drug nacin iskanja je iskanje na posameznih strenikih na internetu tu je navadno iskanje laje saj je na vsakem streniku le omejena kolicina podatkov poleg tega pa so podatki vecinoma vsebinsko in hierarhicno strukturirani nekatere podatkovne baze na omreju internet imajo podatke klasificirane na podlagi deskriptorjev ki pokrivajo doloceno podrocje in tako omogocajo hitreje in enostavneje iskanje podatkov vija oblika seznama deskriptorjev je tezaver pomena tezavra so se v evropski uniji zavedli e zelo zgodaj zato so za potrebe podatkovnih baz evropske unije razvili tezaver eurovoc ta predstavlja skupni imenovalec tudi za druge specialne tezavre in tako omogoca e vecjo integracijo velike kolicine podatkov ki je na voljo v okviru institucij evropske unije tudi v sloveniji se e delajo prve pilotske aplikacije katerih podatkovne baze temeljijo na klasifikacijah po tezavru eurovoc eden taknih sistemov je postavljen na statisticnem uradu republike slovenije klasificira pa zakonodajo evropske unije ki zadeva podrocje statistike verjetno se bodo tej pilotski aplikaciji kmalu pridruile e druge kljucne besede tezaver eurovoc evropska unija informacijski sistemi dravni organi abstract today the internet represents a huge quantity of data that can not be suprevised and that is why it is so hard for a user to find the information he is looking for fo this purpose the internet introdiuced special servers also called search engines which index documents on other servers on the internet hours a day to provide a regularly updated full text index of those documents there is another way to search the data called the microbasis the user can search on a specific server which usually has some search mechanisms and there is a limited amount of data held on a single server above all the data on a single server is usually structured and classified according to different classification rules data is structured based on the descriptor system a more sophisticated descriptor system is called a thesaurus a thesaurus called eurovoc was established very early in the european union it is translated in all official languages and represents the common link for all other specialised thesauruses in slovenia the plans for testing thesaurus eurovoc have already been introuced on of the testing systems is maintained by statistical office of the republic of slovenia keywords thesaurus eurovoc european union information systems government institutions uvod omreje internet je e zdavnaj preraslo vse meje obvladljivosti podatkov potrebno je bilo razviti drugacen pristop do iskanja in klasifikacije podatkov dostopnih na omreju internet v grobem bi lahko govorili o dveh nivojih urejanja podatkov prvi lahko tudi makronivo predstavljajo sploni in specializirani iskalniki podatkov angl search engines katerih skupna znacilnost je da kategorizirajo najveckrat pa zgolj indeksirajo kljucne besede dokumentov sekcije naslove prve odstavke itd z veliko razlicnih strenikov jih aurno obnavljajo uporabnikom pa preko primernega vmesnika ponujajo iskanje po kljucnih besedah dandanes je kolicina indeksiranih besed e tako velika da se redko zgodi da nam iskalnik ne ponudi prav nobene povezave z iskanim izrazom drugi nivo urejanja podatkov je mikronivo najveckrat ima internet strenik v okviru storitve www e vgrajen iskalni mehanizem ki nudi nadrobnejo ponazoritev ponudbe podatkov na tem streniku pogosto so podatki na streniku na tak ali drugacen nacin strukturirani uporabnik navadni ice podatke najprej na makronivoju ko dobi dovolj natancno informacijo o streniku na katerem se nahajajo podatki se preseli na mikronivo tu naleti na strukturirane podatke pogosto so podatki urejeni v sklope ki pomenijo doloceno zakljuceno celoto ali pa oje pojme zdruujejo v ire izraze kljucne besede v evropski uniji so zaradi poenotenja kljucnih besed izdelali poseben tezaver ki pokriva vsa podrocja ivljenja in pomeni skupni imenovalec za specialneje tezavre posameznih podrocij ta tezaver so poimenovali eurovoc podatki v bazah evropske unije so strukturirani na podlagi tega tezavra in specialnejih tezavrov tezaver eurovoc pa pomeni nacin povezovanja razlicnih podatkovnih baz v ire podatkovne strukture tezaver eurovoc ni v uporabi zgolj v evropski uniji ampak ga uvajajo tudi v ostalih vzhodnoevropskih dravah in v dravah bive sovjetske zveze tudi v sloveniji potekajo razmiljanja o moni uporbi tega tezavra kar nam bi pri pridruitvi z evropsko unijo omogocil strukturiran in poenoten nacin povezovanja naih podatkovnih baz z bazami evropske unije na ta nacin bi nae podatkovne baze postale popolnoma zdruljive z bazami evropske unije kar bi poenostavilo uporabo izvoz ter trenje naih podatkovnih baz v tujini iskanje podatkov na omreju internet omreje internet predstavlja prakticno neskoncno mnoico podatkov ki so zaradi casa nastanka urejanja in demokraticnosti interneta kot njegovi poglavitni znacilnosti popolnoma nestrukturirani iskanje podatkov na omreju internet je tako izredno zahtevna naloga problem najlaje ponazorimo z ogromno knjinjico kjer knjige niso urejene niti po abecedi niti po kakem drugem iskalnem kljucu dejstvo da so posamezne zbirke knjig postavljene skupaj nam iskanja dolocene knjige ne olaja bistveno seveda je racunalnitvo prineslo novost v to ogromno knjinjico s pomocjo posebnih iskalnikov angl search engines je mogoce mnoico knjig analizirati tako da nam ti iskalniki pri iskanju dolocenega izraza povedo kje se nahajajo knjige ki vsebujejo iskane izraze ti podatki se neprestano aurirajo tako kot se menja poloaj knjig ki jih posamezni bralci nekje poberejo in drugje odloijo pripeljejo nove knjige odpeljejo stare itd tak globalen nacin iskanja bi lahko poimenovali tudi makronivo iskanja saj nam v grobem pove pozicijo knjig katerih kazalo je indeksirano to pa e ne pomeni da bomo v vsebini knjige nali prav tisto kar nam obljublja naslov kazala tako je glavni problem iskanja podatkov v tem da pri iskanju dobimo mnoico odgovorov od katerih pa jih le nekaj ustreza temi ki jo icemo zato nam pravilna izbira iskalnih izrazov in njihovo kumuliranje navadno mocno znia tevilo danih odgovorov na nae poizvedovanje mikronivo iskanja podatkov pa pomeni njihovo iskanje v okviru enega ali manjega tevila internet strenikov tu so podatki navadno e strukturirani na vsebinskem nivoju v posamezna oja podrocja tako nam sama hierarhija predstavljenih podatkov nakazuje na hierarhicnost predstavljenih podatkov velikokrat pa imajo taki streniki v okviru storitve www world wide web e vgrajen iskalnik podatkov ki redno indeskira vse podatke na tem streniku po polnem besedilu s tem je natancno lociranje iskanih podatkov t i pinpoint e poenostavljeno nekdanja prizadevanja knjinjic da bi podatke cimbolj smoterno razvrstili in klasificirali ter jih tako pribliali uporabnikom so tukaj pripeljana do skrajnosti saj je vsak dokument indeksiran po celotnem besedilu kar ob primerni klasifikaciji zagotavlja optimalno hitrost iskanja podatkov nacini klasifikacije na teh internet strenikih so navadno povezani s posameznimi vedami saj njihovi glavni razredi ustrezajo specificnim podrocjem znanja podrobneja delitev pa naj bi ustrezala zgradbi teh znanstvenih podrocij klasifikacije morajo biti zgrajene po nekaterih formalnih pravilih in s tem zagotavljati enotno identifikacijo dokumentov posebna oblika razvrcanja informacij ki se uveljavlja namesto konvencionalnih klasifikacijskih sistemov je deskriptorski sistem seznam deskriptorjev sestavljajo standardizirane kljucne besede izbrane iz strokovne terminologije s pomocjo katerih icemo podatke deskriptorji sestavljajo poseben jezik imenovan tudi informacijski jezik vija oblika seznama deskriptorjev je tezaver izraz tezaver izhaja iz latinske besede thesaurus zaklad besedice tezavri in tezaver eurovoc tezaver je dinamicen slovar ali skupek semanticno in genericno povezanih izrazov ki pokrivajo doloceno podrocje znanosti in tehnologije lahko bi mu rekli tudi referencni slovar ki pomaga uporabniku izraziti zahtevo po informaciji z izrazi deskriptorskega jezika kar omogoca povezovanje dokumentov in iskalnih nizov vsebovati mora vse deskriptorje ki so vsebovani v dolocenem sistemu poleg tega mora jasno kazati pojmovno sorodnost pa tudi kljucne besede znotraj sistema ki tejejo za sinonime s sprejetimi deskriptorji tako tezaver pomaga izlociti sinonimnost in vecpomenskost kljucnih besed ter odpraviti pomanjkanje pomenskih odnosov med njimi gradnja tezavra poteka v vec stopnjah najpomembneje in neizogibne so sestavljanje skupka angl pool kljucnih besed ki opisujejo podrocje tezavra iz skupka kljucnih besed sestavimo sinonime ki dovolj nazorno predstavljajo posamezne izraze iz slovarja izkljucimo e vecpomenske kljucne besede tako da damo taki besedi simbol in izraz ki oznacuje pomen te kljucne besede vsak tezaver vsebuje slovar besed semanticno strukturo izrazov ter pravila za pretvorbo kljucnih besed naravnega jezika v informacijski jezik ki omogoci samo klasifikacijo podatkov tezaver eurovoc je bil vzpostavljen s strani evropskega parlamenta in urada za uradne publikacije na podlagi odlocitve v letu pri izdelovanju eurovoc a so bili uporabljeni mednarodni iso in afnor standardi in obstojeci e razviti podrocni tezavri prva izdaja datira v leto izla je v sedmih jezikih kot aneks uradnega lista es v letu so se lotili obsene revizije strukture in vsebine ki je temeljila na dveletnem indeksiranju dokumentov v evropskem parlamentu in na izdelavi registra uradnega lista revizija je upotevala socialne ekonomske in politicne spremembe hiter razvoj znanosti ter konceptov povezanih z jezikom kot osnova za prevod v druge jezike je bila uporabljena francoska verzija ob stalnem sodelovanju prevajalcev in dokumentalistov ki so razvili osnovno francosko verzijo izvedena je bila dvojna kontrola prevedene verzije najprej lingvisticna v terminolokem oddelku evropskega parlamenta nato pa e dokumentalisticna ki so jo izvedli knjinicarji in dokumentalisti evropskega parlamenta in urada za uradne publikacije eurovoc je oblikovan multidisciplinarno in pokriva podrocja zanimiva za unijo pa tudi za posamezne drave clanice podrocij slika je pokritih s deskriptorji ki so razdeljeni v mikrotezavrov in od do nedeskriptorjev katerih tevilo variira od jezika do jezika eurovoc je na voljo v uradnih jezikih eu hierarhicna struktura tezavra in asociativne relacije so v vseh jezikih identicne eurovoc kontrolirajo popravljajo in vzdrujejo z racunalnikom tako da je zagotovljena konsistentnost strukture kar olajuje izdelavo jezikovnih verzij omogoca razlicne tipe abecedni stvarni permutirani tezaver in medije publikacij magnetni trak izpisi fotostavek ter izdelavo terminogramov poleg tega se eurovoc uvaja ali pa je e uveden v vecini drav nekdanjega vzhodnega bloka podatkovne baze v evropski uniji ni nakljucje da so se sestavljanju tezavrov posvetili v evropski uniji saj so morali zagotoviti nedvoumno in hitro sporazumevanje v vseh uradnih jezikih hitro in v vseh uradnih jezikih izhaja vrsta publikacij med njimi uradni list eu official journal of the european union mesecni bilten eu letni general report on the activities of the european communities ipd javne baze evropske unije ki za vsebinsko povezovanje podatkov vsebujejo tezaver eurovoc so celex epoque ki vsebuje gradiva evropskega parlamenta in catel indeksirane so bibliografske reference dokumentov primer indeksiranja na sliki kjer je v polju subject ustrezni deskriptor ki jih je obravnaval evropski parlament tudije evropskega in nacionalnih parlamentov katalog knjinjice evropskega parlamenta ter dokumentacija zakonodajnih postopkov in informacije o stanju postopkov baza epoque ima letni prirast cez dokumentov aurira pa se dnevno s tezavrom so v evropski uniji reili dve teavi uvedli so enotno izrazoslovje s prevodom tezavra v vec jezikov pa so omogocili enak nacin dostopa do podatkov ne glede na jezik vira podatkov in tako omogocili vsakomur enake monosti iskanja druge podatkovne baze evropske unije sledijo tezavru eurovoc na marsikaterem podrocju se je pokazalo da uporaba tega tezavra zaradi specialnejega podrocja ne bi bila smotrna zato v takih bazah uvajajo nove tezavre ki pa vsebinsko in oblikovno sledijo tezavru eurovoc kar omogoci njegovo enostavno in logicno nadaljevanje rezultat tega je da je tezaver eurovoc nekaken generalni tezaver ali skupni imenovalec za specialne tezavre ki so njegovo logicno nadaljevanje podatkovne baze v republiki sloveniji streniki v sloveniji so v fazi kjer so klasifikacije na mikronivoju nekaj povsem vsakdanjega kot tipicen primer takih klasifikacij lahko omenimo knjinjicne sisteme cobiss http www izum si sistem internet resursov v sloveniji na streniku ijs http www ijs si slo slovenski intereaktivni pravni informacijski sistem sipis http www sigov si sipis pravni informacijski sistem ius info http www ius software si poslovno informacijski sistem gv in http www gvestnik si in druge skupna znacilnost omenjenih sistemov je tipicna kombinacija dveh iskalnih mehanizmov iskanja po klasifikacijskih znakih oziroma klasifikacijskem sistemu ter iskanja po polnem besedilu iskanje je omejeno na podatke na enem streniku razen pri sistemih ius info ter gv in kjer se kae tendenca po enotni klasifikaciji podatkov kar pa je prej posledica tesnega sodelovanja obeh nosilcev sistemov kot pa vsebinska celovitost z nacionalne plati sta verjetno najbolj popolna dva splona iskalnika prvi je e prej omenjeni sistem resursov v sloveniji drugi pa je kot lahko vidimo tudi reklame sistem tobi http www i rose si tobi ki naj bi bil nekakna altavista po sloveniji sistem redno pregleduje in po polnem besedilu ali pa vsaj po kljucnih besedah indeksira celotno domeno si z drugimi besedami vse strani ki se na internetu koncajo s koncnico si naj bi bile vneene v ta iskalnik slabost iskalnika je ta da omogoca le iskanje po polnem besedilu nima pa ustrezneg tezavra ki bi omogocil klasifikacijo posameznih strani v kategorije tezaver eurovoc bi bil v sloveniji primeren v dravnih institucijah saj je bil razvit prav v ta namen tako bi bil primeren kot klasifikacijski sistem za slovenski pravni informacijski sistem v posameznih bazah dravnih organov pa tudi v posameznih knjinjicah teh organov tezaver eurovoc se e preizkua v kombinaciji z indeksiranjem podatkov po polnem besedilu na statisticnem uradu republike slovenije kot klasifikacijski sistem za zakonodajo evropske unije ki kakorkoli zadeva statistiko zakljucek na omreju internet imamo na voljo prakticno neskoncno kolicino podatkov ki je medsebojno neurejena zaradi tako velike kolicine podatkov so na omreju internet postavljeni posebni streniki ki imajo nalogo indeksirati podatke z drugih strenikov in jih razvrstiti v svoje podatkovne baze glede na kljucne besede ki se pojavljajo v posameznih dokumentih iskanje na posameznih strenikih je zaradi omejene kolicine podatkov njihove strukturiranosti in vsebinske urejenosti navadno laje najvecjo teavo navadno predstavlja lociranje pravega strenika podatkovne baze imajo navadno podatke urejene na podlagi deskriptorjev ce ti deskriptorji zadostijo dolocenim pravilom jih imenujemo tezavri enega najbolj znanih tezavrov tezaver eurovoc so razvili za svoje potrebe in za potrebe drav clanic v evropski uniji tezaver s svojo splonostjo pokriva vsa aktualna podrocja in tako omogoca povezovanje s specialnejimi tezavri kar le poveca ucinkovitost iskalnih mehanizmov v sloveniji se razvijajo aplikacije katerih semanticne strukture temeljijo na klasifikacijah tezavra eurovoc eden taknih sistemov je postavljen na statisticnem uradu republike slovenije po tezavru eurovoc je tam klasificirana zakonodaja evropske unije ki zadeva podrocje statistike taka implementacija kae na vsestranskost tezavra eurovoc kar v luci priblievanja strukturam evropske unije pomeni konkurencno prednost pri trenju slovenskih baz na podrocju evropske unije literatura bavec cene informatika v upravnih dejavnostih univerza v ljubljani vija upravna ola ljubljana str directory of public databases produced by the institutions of the european communities office for official publications of the european commmunities january dok sis ur marko hartman et al slovensko drutvo informatika ljubljana eurostat statistical meta information systems proceedings of the conference luxembourg to february office for official publications of the european commmunities eurovoc in computer environment delovno gradivo eu parliament warzsawa eurovoc multilingual thesaurus office for official publications of the euroepan communities luxembourg eurovoc permutated thesaurus office for official publications of the euroepan communities luxembourg eurovoc subject oriented thesaurus office for official publications of the european communities luxembourg indo informatika v dravnih organih zbornik referatov republika slovenija center vlade za informatiko ljubljana klep j eurovoc kot oblika komunikacije z evropsko unijo zbornik referatov radenci klep j uporaba tezavrov v informacijskih sistemih seminarska naloga fakulteta za organizacijske vede kranj magistrski tudij rokopis klep j sirnik i kufca u eurovoc projektna dokumentacija delovno gradivo kufca u uporaba tezavra eurovoc v informacijskih sistemih na omreju internet v trinar i urbas m urednici statisticni dnevi radenci november zbornik kufca uro pravni informacijski sistemi in njihova izvedba v sistemih za obravnavo dokumentov rokopis diplomska naloga visoka upravna ola ljubljana literatura dostopna na omreju internet ius info url http www ius software si cvi url http www sigov si sipis url http www sigov si sipis gospodarski vestnik gv in url http www gvestnik si ijs mat' kurja url http www ijs si slo uradni list rs url http www uradni list si cobiss knjinicni sistem izum url http www izum si eurovoc ceki projekt url http www psp cz eurovoc seminar samek html povzetek danes je v omreju internet sprevljeno znanje celotne moderne drube problem take kolicine podatkov pa je v njihovi neurejenosti zaradi lajega iskanja so na internetu postavljeni posebni iskalniki podatkov ki indeksirajo mnoico dokumentov na internetu poleg tega so iskalni mehanizmi postavljeni tudi na posameznih strenikih saj je tam kolicina podatkov obvladljiva obenem pa tudi urejena na takih strenikih so podatki klasificirani na podlagi deskriptorjev ponekod pa celo na podlagi tezavrov ki so posebna oblika deskriptorjev v evropski uniji so e zelo zgodaj zaceli uvajati enoten generalni tezaver eurovoc ki je preveden v vse uradne jezike tezaver predstavlja skupni imenovalec za specialneje tezavre tudi v sloveniji podobno kot v drugih vzhodnoevropskih dravah preizkuajo tezaver eurovoc kot podlago za klasificiranje vrste podatkov primerne za trenje v druge drave summary nowadays the internet represents the whole knowledge of modern community the main problem of such amount of data is that the data is not globally structured in order to ease the search of information there are plenty of search engines available which index huge amounts of documents on internet besides that there are certain mechanisms located on nearly every internet server that help searching the information by classifying data in orderly manner the data on those servers is commonlz classified with descriptors somwhere even a thesaurus which is a special form of descriptors the common general thesaurus of the european union eurovoc which is translated into all official languages of the european union has been established in for quite some time now the thesaurus represents the main link for all other eu specialised thesauruses as in other eastern european countries the thesaurus eurovoc is also being teste in slovenia being the base for classification of a statistical information system in statistical office of the republic of slovenia podatki o avtorju uro kufca je diplomant pravne fakultete v ljubljani in diplomant visoke upravne ole v ljubljani na smeri javna uprava je tudent letnika visoke policijsko varnostne ole v ljubljani e vrsto let se ukvarja s podrocjem informatike sodeloval je na razvojnih nalogah na podrocju programiranja v razlicnih objektnih programskih jezikih in na podrocju nacrtovanja podatkovnih baz kasneje se je usmeril na podrocje interneta sodeluje pri projektih na podrocju uporabe interneta in na podrocju elektronskega poslovanja v okviru javnih narocil od zacetka tudija se poglobljeno ukvarja s podrocjem pravne informatike author uro kufca is a graduated member of faculty of law and a graduated member of high school of public administration presently he is studying at college of police and security studies in ljubljana he has contributed to several development projects on the field of programming in various object oriented languages and design of databases his further experience is internet and design of marketing solutions on internet and electronic procurment from the beginning of the study he intensively works on law information systems including orientation to the web copyright uro kufca