Esperanto en de computer

Het Esperantoalfabet wordt geschreven met karakters die uniek zijn aan het Esperanto: Ĉ, ĉ, Ĝ, ĝ, Ĥ, ĥ, Ĵ, ĵ, Ŝ, ŝ, Ŭ, ŭ. Het boogje boven de Ŭ en ŭ is overgenomen van het Cyrillisch alfabet. Het Esperantoschrift is dus eigenlijk niet 100% Latijns. En dat kan wel eens problemen opleveren bij het typen van Esperantoteksten, maar bijvoorbeeld ook bij het versturen van e-mail. Toen Zamenhof in 1887 Esperanto lanceerde, had hij uiteraard geen idee dat de 'hoedjes' zulke problemen zouden geven op computers. Voor typemachines en bij problemen met het drukken van boeken stelde hij voor om de hoedjesletters te vervangen door de letter + h, bv. 'ch' voor 'ĉ' (chirkauajho = ĉirkauaĵo) en het boogje boven de u (ŭ) achterwege te laten.

In de loop der jaren is op internet echter het gebruik van de x-methode ingeburgerd geraakt. Men vervangt dan 'ĉ' door 'cx' (cxirkauxajxo = ĉirkauaĵo), o.a. omdat op die manier met behulp van bepaalde programma's alles vlotter kan worden omgezet in het Esperanto met hoedjes.

Waarom zoveel problemen met al die karakters

In de informatica is een karakter een gegevenstype dat traditionele schriftelijke karakters representeert. Een bekende definitie van dit gegevenstype is ASCII, dat echter al snel wegens de enorme diversiteit aan schrijfwijzen in de wereld, zoals Chinees, Cyrillisch, Arabisch of Hebreeuws, hopeloos inadequaat bleek. Zelfs Duitse umlaut-klinkers of Franse accenten kunnen niet in ASCII worden uitgedrukt. Al snel werd Extended ASCII dan ook gangbaar, dat in ieder geval de Europese schrijfwijzen aankon. Maar waarom zit er op het toetsenbord van een computer geen Nederlandse IJ, een Franse ç, een Chinees of een Georgisch karakter? Dat komt door de Noord-Amerikaanse ict'ers. Bij het ontwerpen van de eerste computers met een toetsenbord vonden zij in 1968 de 26 letters van het Engelse alfabet voldoende. Elke grote fabrikant mocht de tekens op zijn manier nummeren, zolang het maar binnen 128 tekens (zeven-bits) bleef. Dat werd anarchie. Om uitwisseling van computerbestanden te vereenvoudigen ontwierpen Amerikaanse ict'ers: ASCII (American Standard Code for Information Interchange). In de praktijk leidde ASCII tot discriminatie van alle andere talen. Met eerst 'extended ASCII' en later ISO-8859 probeerden ICT-deskundigen hieraan een einde te maken door de tabel met een bit uit te breiden. De overstap van zeven-bits naar acht-bits maakte het coderen van een tweede groep van 128 karakters mogelijk, veel meer dan er op het voor ASCII-ontworpen toetsenbord zitten. Het gevolg: tot ver in de jaren negentig hielden alle niet-Engelse computergebruikers een papieren lijstje in de buurt: Alt-137 leverde een ë enzovoorts. Ontbrak het lijstje, dan tikte men gewoon net zolang driecijferige codes in tot de gewenste �, � of ï gevonden was. Als tekst op een floppy werd verstuurd naar een ander computergebruiker ging het mis. Pc-fabrikanten poogden hun klanten voorgoed te vangen binnen hun systeem. De verschillende 'code pages', toevoegingen aan ASCII en ISO-8859, die ze met hun computers meeleverden, voorkwamen een bruikbare uitwisseling met de concurrent. Wie in die tijd een Frans document ontving dat was ingetikt op een van de eerste Apple-computers, kon er zeker van zijn dat de tekst onleesbaar bleef op het scherm van een Franse IBM-pc. Nog ingewikkelder was de uitwisseling van een tekst gemaakt met ISO-8859-8 (Hebreeuws); het werd een onbegrijpelijke karakterbrij op een computer die alleen ISO-8859-1 (Latin-1, ofwel West-Europees) begreep. Internet maakte de verborgen uitwisselingsproblematiek in een klap duidelijk. Een document maken dat bijvoorbeeld Russisch, Japans en Arabisch bevat, kan immers niet met ISO-8859.

...en oplossingen!

Unicode is dé oplossing voor talen met ongebruikelijke tekens. Afhankelijk van het programma en besturingssysteem waarmee je werkt, kun je op je computer Unicode op diverse manieren gebruiken. Het is dus niet meer nodig om te kiezen tussen de h- of x-methode: gebruik gewoon de tekens met hoedjes! Unicode wordt ook ondersteund door alle moderne browsers.

Wat is Unicode? ( UTF-8)

Unicode biedt een uniek getal voor elk teken,
ongeacht het gebruikte platform,
ongeacht het gebruikte programma,
ongeacht de gebruikte taal.

Computers werken in feite alleen met getallen. Ze slaan letters en andere tekens op door aan elk teken een getal toe te wijzen. Voordat Unicode werd ontwikkeld, bestonden er honderden verschillende codeersystemen die werden gebruikt om deze getallen toe te wijzen. Geen enkele codering bevatte echter voldoende tekens. Zo zijn in de Europese Unie alleen al verschillende coderingen vereist voor alle talen binnen dit gebied. Zelfs voor één taal, zoals het Nederlands, kan geen enkele codering alle gangbare letters, leestekens en technische symbolen weergeven.

Deze codeersystemen zijn bovendien strijdig met elkaar. Twee coderingen kunnen namelijk hetzelfde getal gebruiken voor twee verschillende tekens of verschillende getallen gebruiken voor hetzelfde teken. Elke computer (met name een server) moet veel verschillende coderingen ondersteunen, maar wanneer gegevens worden uitgewisseld tussen verschillende coderingen of platforms, is de kans altijd aanwezig dat hierbij gegevens verloren gaan of gewijzigd worden.Unicode brengt hier verandering in. De komst van de Unicodestandaard en de beschikbaarheid van programma's die deze standaard ondersteunen vormen een van de belangrijkste ontwikkelingen in de globalisering van softwaretechnologie.

Wat betekent dat voor jou

UTF-8 werd in 1993 geïntroduceerd. Rond het jaar 2000 zijn de Linuxbesturingssystemen overgestapt naar UTF-8 als standaard voor alle tekstbestanden (inclusief scriptbestanden).

Microsoft heeft ook de UTF-8-codering toegevoegd. Indien in Microsoft Windows een tekstbestand met de UTF-8-codering wordt opgeslagen, voegt Microsoft 3 bytes toe aan het begin van het bestand. Dit is de "Byte Order Mark", of kortweg "BOM", en zijn: 0xEF, 0xBB, 0xBF. Deze UTF-8 BOM wordt echter niet altijd door andere programma's goed herkend.

Webpagina's kunnen ook UTF-8 gebruiken. In de broncode van de webpagina's wordt dan aangegeven dat het om UTF-8-code gaat. De meesten geven voor webpagina's de voorkeur aan UTF-8, omdat dit bij andere talen minder onduidelijkheden geeft dan de ASCII of ANSI codering. In 2009 gebruikt bijvoorbeeld Wikipedia en ook Esperanto-Nederland UTF-8 voor de broncode van de webpagina's. Ook in e-mail wordt steeds vaker de UTF-8 codering gebruikt.

Besturingssystemen

Windows

Om de letters die karakteristiek zijn aan het Esperanto: Ĉ, ĉ, Ĝ, ĝ, Ĥ, ĥ, Ĵ, ĵ, Ŝ, ŝ, Ŭ en ŭ te kunnen maken, kun je in tekstverwerkers zoals Microsoft Word de Esperantoletters laten verschijnen door zelfgekozen toetscombinaties, of een macro te maken. Handiger is het te kiezen voor een programma als Tajpi
Tajpi is een programma dat je in staat stelt Esperantoletters met hoedjes te typen in alle Windowsprogramma's die Unicode ondersteunen (zoals Word, Powerpoint, Outlook, Internet Explorer, Mozilla en andere). Tajpi werkt ook onder Windows 7, 8, 10 en 11.

Linux

Onder Linux kan het op 2 manieren:
1. Er is ook een soort programma als Tajpi: IBUS!
Het programma is te vinden in het softwarecentrum van bijna alle Linux-distributies, zoals Ubuntu, Kubuntu, Suse, Fedora en Debian.

IBus is een intelligente invoerbus voor Linux/Unix. Je kunt hier op verschillende manieren Esperantoletters maken. Omdat UTF-8 sinds het jaar 2000 standaard is, hoef je in de programma's niets te veranderen. IBUS! is vaak al standaard geïnstalleerd. Klik op de foto's voor de instellingen.

Klik op Systeem → Voorkeuren en ga naar Ibus-voorkeuren.
De eerste keer vraagt het programma of het gestart moet worden. Bevestig dat. Op het tabblad Algemeen staat hoe je de sneltoets kan in- of uitschakelen: Control+spatiebalk.
Op het tabblad Invoermethode klik je op Kies een invoermethode.
Ga naar Esperanto en kies b.v. Esperanto – x-sistemo.
Klik op toevoegen.
Nu kun je het systeem gebruiken door bijvoorbeeld cx te typen: er komt automatisch een ĉ.

2. Sinds een aantal jaren is het nog makkelijker geworden om Esperantoletters te maken en kan het het bovenstaande overslaan. Het staat al ingesteld en is slechts een kwestie van 2 vinkjes zetten. Zie foto.
Ga naar instellingen en klik op Toetsenboord opties instellen en vink Esperantoletters toevoegen aan.
Nu kan je met de rechter ALT-toets ingedrukt te houden de gewenste letters maken.
Dus ALT+c geeft:ĉ. etc.

Verder

De populaire browser Firefox, die iedereen vrij kan gebruiken, bestaat nu ook in het Esperanto. Firefox is een gratis verkrijgbare browser, en wordt in het Esperanto ook wel ‘Fajrovulpo’ genoemd. Firefox is een geduchte concurrent van Microsoft Internet Explorer. Volgens veel specialisten is Firefox betrouwbaarder en veiliger dan Microsoft IE.
Overigens is het Linux-besturingssysteem bijna geheel vertaald in het Esperanto en gratis te krijgen. Dus niet alleen één programma, maar de gehele omgeving. Klik op de foto's.

Lettertype

Hieronder tref je enkele minder formele lettertypes aan die je kunt downloaden door er op te klikken:


Ecofont met hieraan toegevoegd de esperantotekens. Met dit lettertype kun je tot 20% inkt besparen.


Welkom

Esperanto Nederland

Overige

Esperanto leren



Geschiedenis

Gratis

Plaatselijke Groepen

Informatie over de taal

Bonvenon

Esperanto Nederland

Lokaj grupoj

Instruado



Ceteraj

Turista informo

Historio

eLibroj