previous up next next up previous contents index naprej naravni jezik navzgor kodiranje slovenskih znakov nazaj kodiranje slovenskih znakov subsections sedembitna kodna tabela osembitna kodna tabela veczlozna vecbytna kodna tabela preglednice kodnih tabel postscript kodna tabela crke in drugi znaki so v racunalniku predstavljeni s pomocjo tabele imenovane kodna tabela ali kodni razpored ki povezuje graficno predstavitev nekega znaka z njegovim binarnim zapisom tako znaku za veliko crko a pri nekaterih kodnih tabelah ustreza desetisko stevilo kot je v racunalnistvu navada moramo biti pazljivi in se prepricati v katerem stevilskem sistemu je navedeno stevilo razen desetiskega sistema se uporabljata se osmiski in sestnajstiski ter v izpisih redko dvojiski nacini kako slovenske znake predstaviti v racunalniku se mocno razlikujejo kar je tudi vzrok za mnoge tezave s prenosljivostjo besedil v uporabi je veliko stevilo razlicnih kodnih tabel kodne tabele so enozlozne enobytne ali veczlozne vecbytne glede na to kako je najvec dolg zapis enega znaka enozlozne enobytne tabele se nadalje delijo na sedembitne kjer znaku sme pripasti najvec desetiska stevilka in na osembitne ki vkljucujejo tudi znake med vkljucno mestoma in zvrsti kodnih tabel z nekaterimi primeri so prikazane na sliki caption slika zvrsti kodnih tabel z nekaterimi primeri \begin figure \begin center \special em linewidth pt \unitlength mm \end \end picture \end center \end figure sedembitna kodna tabela sedembitno kodiranje je starejse in se se vedno uporablja tam kjer na primer ne zelimo tezav pri prenosu dokumentov po elektronski posti uporabno je tudi kot najmanjsi skupni imenovalec ki ga razume najvecja mnozica operacijskih sistemov in na njih vezane programske opreme zal pri tem v praksi sumnike pisemo kot sicnike tako da je besedilo vcasih zaradi tega dvoumno posebej razvpit je dvoumni primer problem je resen omejitve zaradi katerih smo bili se nedavno prisiljeni uporabljati sedembitna kodiranja z napredkom izginjajo primer sedembitnega kodiranja je jus i b kot uporaben sedembitni nadomestek za osembitno kodiranje s posebnimi znaki za sumnike se najvec uporablja zapis kjer so sumniki nadomesceni s sicniki prek katerimi stoji znak '' tudi to kodiranje uvrscamo med sedembitna kodiranja ceprav so znaki za sumnike razvezani cez vec kot en byte osembitna kodna tabela od osembitnih kodiranj se najvec uporablja kodiranja latin iso na sistemih unix in cp ter cp pod ms dos oziroma okni osembitno kodiranje se trenutno uporablja najpogosteje pri cemer pa ze obstajajo naprednejsi vecbytni standardi med katerimi je potrebno omeniti standard unicode avtor se zaradi tega ker je kodiranje latin uvrsceno med mednarodne standarde ki jih je potrdil iso in zaradi njegove razsirjenosti zavzema za uporabo kodiranja latin dokler ne bo vecina kljucnih orodij podpirala novega standarda unicode vsa druga tu imenovana osembitna kodiranja nimajo statusa mednarodnega standarda in so kvecjemu industrijski standardi ki jih dolocajo nekatere programske hise uporabljamo jih lahko le kot pomozno kodiranje potem ko smo kot osnovno izbiro ponudili katero izmed mednarodno standardiziranih moznosti veczlozna vecbytna kodna tabela veczlozna angl multibyte kodiranja so tista pri katerem zapisu enega znaka pripada eden ali vec zlogov bytov znaki za slovenske sumnike so po mednarodnem standardu iso iec unicode uvrsceni v podrocje latin extended a ti znaki so vsi v obmocju u to u f to je od znaka v desetiskem zapisu do znaki v razporedu unicode so oznaceni takole u xxxx oznaka xxxx je sestnajstiski zapis lege znaka v kodni tabeli vec o tej temi na http czyborra com unicode characters html preglednice kodnih tabel tabela prikazuje standardizirane nabore znakov z vsemi slovenskimi sumniki v tabeli so navedeni preostali nacini kodiranja ki pa niso standardizirani codepage codepage iso jus html i b utf latin oct dec hex oct dec hex oct dec hex oct dec hex znaki c ac c c e c f e e e s e a a b s e a b b z a e ae z a e be caption tabela standardizirani nabori znakov z vsemi slovenskimi sumniki kodna nabora cp in cp sta industrijska standarda kodni nabor iso je mednarodni standard caption slika razpored iso sliko je prispeval roman czyborra \begin figure \begin center \end center \hrule\end figure caption slika razpored iso sliko je prispeval roman czyborra \begin figure \begin center \end center \hrule\end figure caption slika razpored iso v pisavi fixed \begin figure \begin center \end center \hrule\end figure caption slika druga stran razporeda iso v pisavi clearlyu avtor mark leisher \begin figure \begin center \end center \hrule\end figure tex latex latex tex babel znaki znaki znaki znaki c \ c \v c \v c c \ c \v c \v c s \ s \v s \v s s \ s \v s \v s z \ z \v z \v z z \ z \v z \v z caption tabela pogostejsi nacini kodiranja sumnikov v sistemih tex in latex teletype ascii quoted printable apple coreldraw amiga utf sicniki iso ce dvobytni znaki znaki znaki hex hex hex hex znaki c cc c c c c c cc c e b c d s ss s a e c a s ss s b e c a z zz z ae eb c bd z zz z be ec c be caption tabela pogostejsi nestandardizirani nabori znakov z vsemi slovenskimi sumniki slovarsko dvispell sca kodiranje kodiranje baza armorial znaki znaki znaki c cz c caron cv c cz c caron cv s sz s caron sv s sz s caron sv z zz z caron zv z zz z caron zv caption tabela redkejsi nestandardizirani nabori znakov z vsemi slovenskimi sumniki baza sca armorial vec o tej temi na http www sca org heraldry oanda data symbols html postscript sgml c ccaron ccaron c ccaron ccaron s scaron scaron s scaron scaron z zcaron zcaron z zcaron zcaron caption tabela opisno kodiranje znakov za sumnike v jezikih postscript in sgml java c \u c c \u d s \u s \u z \u d z \u e caption tabela v javi se od razlicice uporablja standard unicode najprej v razlicici in kasneje v iso dec hex ime c c latin capital letter c with caron c d latin small letter c with caron s latin capital letter s with caron s latin small letter s with caron z d latin capital letter z with caron z e latin small letter z with caron caption tabela tabela z imeni iso za slovenske znake s sumniki mes dec hex ime c c latin capital letter c with caron c d latin small letter c with caron s latin capital letter s with caron s latin small letter s with caron z d latin capital letter z with caron z e latin small letter z with caron caption tabela tehnicno porocilo env o minimalnem evropskem podnaboru mes nabora iso iec sumniki so v tabeli nabora mes na enakih mestih kot v iso o mes vec o tej temi na http www indigo ie egt standards mes html rfc znak c c c c s s s s z z z z caption tabela opisno kodiranje sumnikov kot ga predlaga rfc rfc vec o tej temi na http andrew andrew cmu edu rfc rfc html apple macintosh vec o tej temi na http www kostis net charsets applecro html pogostejse oznake z enakim pomenom ibm cp ibm pogostejse oznake z enakim pomenom iso yu jus i b isoir yuscii sloscii pogostejse oznake z enakim pomenom iso iso iso l latin isoir pogostejse oznake z enakim pomenom html html w www pogostejse oznake z enakim pomenom utf filesystem safe fss utf utf vec o tej temi na http czyborra com utf vec o tej temi na http www adobe com supportservice devrelations typeforum glyphlist t xt slike znakov v obmocju u do u f so dostopne na strani http charts unicode org unicode charts glyphless u html utf je nacin kako zapisemo znake po razporedu unicode z najvec stirimi bajti spodnja funkcija zapisana v jeziku c pretvori znak s kodo po razporedu unicode v zapis utf putwchar c if c x putchar c x x x x x x x else if c x putchar xc c x x x x x putchar x c x f x x x x x x else if c x putchar xe c x x x x putchar x c x f x x x x x x putchar x c x f x x x x x x else if c x putchar xf c x x x putchar x c x f x x x x x x putchar x c x f x x x x x x putchar x c x f x x x x x x nekatere implementacije se kodiranja utf ne drzijo dobesedno utf v razlicici kot ga razume java drugace zapisuje znak in pozna le trobajtni podnabor quoted printable ni poseben kodni razpored tako se imenuje zapis osembitih znakov s sedembitnimi da se izognemo morebitnim tezavam pri prenasanju po mrezi ali med sistemi znaki nad mestom so zapisani tako da znaku sledi njihova dvocrkovna sestnajstiska koda postscript jezik postscript je nastal okrog leta v podjetju evans sutherland computer kjer so ga imenovali 'design system' nastal je kot rezultat razikovalnega projekta ki se je ukvarjal z uporabnostjo interpretiranega jezika za opis zapletenih tridimenzionalnih objektov hranjenih v podatkovnih bazah projekt je uspel in jezik se je prijel za uporabo v aplikacijah cad znaki so po adobeovem standardu za postscript predstavljeni v dveh oblikah s kodo ali z opisnim imenom vsak znak ima ime in svojo graficno podobo kodiranim znakom pripada pa se enobytna koda adobeov postscript language reference manual v zvezi s slovenskimi znaki predpise le imena za male in velike crke s in z crko c zal tedaj izpusti a jo kasneje doda preglednica podaja imena za slovenske znake noben sumnik nima svoje bytne kode next up previous contents index naprej naravni jezik navzgor kodiranje slovenskih znakov nazaj kodiranje slovenskih znakov gnu slovenizacija