Blind Höna

Sedan 2001

Rädda ett skrivtecken

17 november 2003 | 4 kommentarer

Det finns en särskild lockelse med utländska tecken och alfabet. De förefaller mycket mer dekorativa än våra gamla invanda a:n, b:n och c:n – att tatuera sig med utländska tecken är rätt populärt. (Anna vet vad hennes tecken betyder, men man hoppas att andra också gör det.)

Adelyn, typsnitt fråb De drabbadefVi tycks vara rätt beredda att tillskriva dem särskilda, magiska egenskaper: för SVTs ganska träiga thrillerserie ”De drabbade” får ett teckensystem som ser ut som en fyrkantigare variant av etiopiska fungera som motor i intrigen (och SVTs sajt erbjuder en att ladda ner teckensnittet, kallat ”Adelyn”).

Men även om ”utländska” tecken verkar exotiska är de ju bara praktiska uppfinningar – medel för kommunikation, rätt och slätt.

För bara ett par år sedan såg ryska, arabiska, koreanska, vietnamesiska eller grekiska webbsidor mest ut som… tja, grekiska på skärmen. Att läsa dem krävde krångliga installationer och manuella byten mellan olika system för ”encodings” (bara för ryska fanns det fyra olika – tre baserade på erkända standards och sedan givetvis Microsoft/Windows ”egna standard”).

Vietnmesisk textMen nu kan jag på nätet hitta till exempel vietnamesiska tidningar som skriver om avslöjandena kring Tiger Force’s krigsförbrytelser – och de framträder av sig själva alldels korrekt på skärmen. (Nej, kan kan inte läsa vietnamesiska – men jag ser att det blir OK.)

Att det är så enkelt beror på att moderna program och operativsystem (i mitt fall det fantastiskt luxuösa och pålitliga Mac OS X) bygger på Unicode, ett system som ska kunna återge (i slutändan) all världens skriftsystem.

Tack vare Unicode, och att Mac OS kommer med färdiga typsnitt och teckenuppsättningar för en lång rad språk, är det numera nästan aldrig några problem. Jag kan plocka upp ryska mejl jag fick för tre-fyra år sedan, och som var oläsbara då – och läsa dem. (Det har också tyvärr gjort det mer attraktivt att skicka spam från andra språkområden.) Jag skulle till och med kunna skriva min webblog med runor eller i linear B, om jag ville; har du en Unicode-baserad dator skulle du kunna läsa den.

'Kummin' skrivet med Linear B-teckenAtt klassificera och kodifiera tecknen är dock ett tidsödande och manuellt arbete. Alla skriftsystem har sina problem: Linear B är en stavelseskrift, och sådana har betydligt fler tecken än ljudenliga alfabet. Vietnamesiska, å andra sidan, skrivs med (i princip) latinska bokstäver, men med tillägg av en hel mängd s.k. diakritiska tecken – små krokar, prickar och streck som kan hakas fast på bokstäverna upptill, nedtill eller på ömse sidor.

Det gör det besvärligt att producera vietnamesiska med västerländska tangentbord: en hel rad tangenter måste omdefinieras så att de inte är framstegande. (Ett svenskt tangentbord har bara en icke-framstegande tangent: den längst upp till höger som sätter dit akut och grav accent över e eller a. Vietnamesiska behöver många sådana.) Jag vet: för ett antal år sedan var jag inblandad i den första fotosättningen av vietnamesisk text i Sverige över huvud taget. Det var ett skivomslag för en vietnamesisk folkmusikensemble, utgiven av Rikskonserter. Jag skaffade fram själva typsnittet; men dessutom måste fotosättningsmaskinen ha nya drivers med mera – det var ett sagolikt krångel.

Men Unicode – nu i version 4.0 – löser de flesta problem beundransvärt. Systemet har plats för 96.000 tecken; ungefär 70,000 av dem är kinesiska tecken. för närvarande har 54 andra skriftsystem inrymts bland de 26.000 tecken som finns därutöver – från thai till cherokee.

Men trots att många stora skriftsystem redan tagit plats i Unicode-systemet, återstår fortfarande ett stort antal. Och nu börjar pengarna tryta, enligt en mycket läsvärd artikel i New York Times från september:

”As vast as Version 4.0 seems, it is still not complete, and nearly 100 writing systems remain to be encoded. Mr. Everson is haunted by the prospect that Unicode may never be finished. ’Imagine how you would feel if your name was François, but there was no ç available,’ Mr. Everson said. ’You would be irritated that your phone bill came addressed spelling your name wrong. Now imagine if your language used a totally different alphabet and you couldn’t use computers at all because of it. It’s a question of human rights, really.’

An incomplete Unicode is a looming possibility, however. Now that the writing systems of the major computer markets are encoded, the computer companies that once backed the Unicode project are beginning to question the expense. To ensure that the remaining writing systems are included, a project named the Script Encoding Initiative has been set up at the University of California at Berkeley to enlist scholars and apply for funds from private foundations to hire Mr. Everson full time.”

(NY Times: For the World’s A B C’s, He Makes 1’s and 0’s, 25 sep)

Hos Script Encoding Initiative kan man läsa vilka skriftsystem som behöver kodas (och donera pengar).

Man kan faktiskt också bli medlem i Unicode-konsortiet: för privatpersoner kostar det 120 dollar per år. Läs mer på: www.unicode.org. Där finns också beskrivningar i pdf-format över de språk man hittills kodifierat. Många snygga tecken att ha spm förlagor till nästa tv-serie eller tatuering.

Kommentarer

4 kommentarer to “Rädda ett skrivtecken”

  1. Anna
    november 18th, 2003 @ 08:41

    Härmed intygas på heder och samvete att jag vet exakt vad som står på min vänstra arm. Dvs ingenting för utom ett A och ett spegelvänt A. Och jag skulle skriva ut Anna så skulle det se ut så ungefär såhär: अननI (Fast de två न skulle sitta på samma ”pinne”) och det blir inte lika symmetriskt=estetiskt. Men det visste du ju redan att jag visste 🙂

  2. Jonas
    november 18th, 2003 @ 09:00

    Härmed intygas att Annas intygande är korrekt – det där med att inte veta vad det står gällde förstås inte henne!
    Återstår bara att tillägga att tecknen på Annas axel är devanagari, ett skriftsystem som används för att skriva bl.a. hindi.

  3. Fredrik
    mars 18th, 2005 @ 13:43

    ”Systemet har plats för 96.000 tecken”
    Nja, det har plats för 1114112 tecken, men du har säkert rätt i att ungefär hundra tusen platser används i version 4.
    (jag skrev Unicode-implementationen för Python, så en gång i tiden kunde jag allt om Unicode 3 punkt någonting. Lyckligtvis rymmer inte min hjärna hur mycket som helst, så det mesta har trillat bort…)

  4. David
    februari 4th, 2010 @ 00:49

    Någon som vet var man kan få tag på Adelyn Typsnittet? Jag skulle vara väldigt tacksam om någon vet. Hittar du något så maila mej på david@wallhult.se
    Tack!!

Kommentera





Om Blind Höna

Bloggen Blind Höna startade 2001 på adressen kornet.nu/blindhona/. Nu har den flyttat hemifrån till en egen adress. Men det är samma blogg.

Min bok "Jävla skitsystem!" har en egen blogg på javlaskitsystem.se.

RSS-flöde

Sök

Admin