Hogyan írjunk magyar ékezetes weblapokat?

Ha az Interneten járkálunk, akkor állandóan olyan oldalakba ütközünk, melyekben kalapos ű-k és hullámos ő-k láthatók az odaillő magyar betűk helyett (egyéb extrém karakterekről nem is beszélve). A legnagyobb kikötők között is sok található, ahol hibásak az ékezetek. Leszámítva azokat az igénytelen weblapszerkesztőket, akik még a grafikákba is a rossz karaktereket írják bele, az illetékesek azzal szoktak védekezni, hogy nincs szabványos módszer, amely minden böngészőben működne. Én mégis ajánlanék ilyesmit.

A legegyszerűbb módszer az, hogy a lapunkba a normál Windows (Linux) ékezetes karaktereket változatlan formában beleírjuk, és a HTML fájl elején a fejlécben jelezzük, hogy karaktereink a közép-európai kódlap szerint értendők:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2">

Az "iso-8859-2" helyére "windows-1250"-et is írhatunk. (Megoszlanak a vélemények, hogy a Nemzetközi Szabványügyi Szervezetnek vagy a Microsoftnak van-e nagyobb szava a kérdésben.)

Az előbbi beállításnak működnie kell, ha mégsem működik, akkor például a következők lehetségesek:

Ha a "nagy" böngészőprogramokat használjuk (Netscape, Internet Explorer), akkor az első két lehetőség nem szokott előfordulni. Ha az a probléma, hogy nincsenek megfelelő magyar ékezetes betűink installálva, akkor ezen egy telepítéssel tudunk segíteni. Egyébként betűkészlet hiánya azt is okozhatja, hogy a lapba írt hullámos ő helyett helytelenül normál magyar ő betű jelenik meg.

Amikor valamit lehívunk egy webszerverről, akkor az közli velünk a lehívott dolog MIME típusát, HTML oldal esetén azt, hogy "text/html". Ehhez opcionálisan hozzáfűzi a használt karakterkészletet is. Ha a szerver megadja a karakterkészletet, akkor az fontosabb, mint amit a META tagek között adunk meg, tehát a mi meghatározásunkat nem fogja a böngésző figyelembe venni. Ha nincs beleszólásunk a szerver beállításába, akkor a következő bekezdésekben leírt módszert használhatjuk.

Ha a HTML forrást valami okból muszáj tiszta ASCII karakterekből megcsinálnunk, vagy ha az alapértelmezett karakterkészlet valami más, és csak néhány szó erejéig van szükségünk magyar karakterekre, akkor karakterhivatkozásokat is használhatunk.

A karakterhivatkozások "&" jellel kezdődnek, és pontosvesszővel fejeződnek be. E kettő között vagy egy név, vagy egy kettőskereszt után a karakter unicode kódja található. A karakterhivatkozások jelentése független attól, hogy milyen karakterkészletet állítottunk be. A következő kódok tehát mindig a jelzett betűket jelentik:

&oacute; ó &Oacute; Ó hosszú o
&ograve; ò &Ograve; Ò o balra dőlő vesszővel
&otilde; õ &Otilde; Õ hullámos o
&ocirc; ô &Ocirc; Ô kalapos o
&ouml; ö &Ouml; Ö o umlauttal (magyar rövid ö)
&#337; ő &#336; Ő o hungarumlauttal (magyar hosszú ő)
&uuml; ü &Uuml; Ü u umlauttal (magyar rövid ü)
&#369; ű &#368; Ű u hungarumlauttal (magyar hosszú ű)

Könnyen lehet, hogy most a hullámos és a helyes ő betű közül csak az egyik látható. Ha ez így van, akkor a böngésző nem tud két különböző betűkészletből egyszerre betűket válogatni. Ettől persze a mi lapunk még lehet tökéletes.

Akinek a véleményét olvastad: Nagy Ferenc László