Tekst ten ma ułatwić redagowanie kaszubskojęzycznych stron internetowych.
Przedstawię dwie – moim zdaniem najlepsze – możliwości prezentacji kaszubskojęzycznych tekstów w internecie.
Marek Kwidziński (grudzień 2002)
Spis treści:
I. Zestawienie kaszubskich „ogonków” w iso – 8859-1, iso – 8859-2, utf-8 jak i alternatywnym zapisie html.
II. Unicode – Standard dla języka kaszubskiego.
1. Początek strony w utf – 8.
2. Jak pisać?
3. Przykład
III. ISO-8859-2 ( ISO-Latin-2 )
1. Początek strony w iso-8859-2.
2. Jak pisać?
– Zestawienie alternatywnego zapisu kaszubskich „ogonków” html.
3. Przykład
Tab. 1 – Kaszubskie „ogonki” w : iso – 8859-1, iso – 8859-2, utf-8 jak i alternatywnym zapisie html.
HTML 4.0 |
ISO-8859-1 | ISO-8859-2 | HTML – Alt. | UNICODE |
Ą | – | ¡ | – | Ą |
ą | – | ± | – | ą |
à | à | – | à | à |
ã | ã | – | ã | ã |
É | É | É | É | É |
é | é | é | é | é |
Ë | Ë | Ë | Ë | Ë |
ë | ë | ë | ë | ë |
Ł | – | £ | – | Ł |
ł | – | ³ | – | ł |
Ń | – | Ñ | – | Ń |
ń | – | ñ | – | ń |
Ò | Ò | – | Ò | Ò |
ò | ò | – | ò | ò |
Ó | Ó | Ó | Ó | Ó |
ó | ó | ó | ó | ó |
Ô | Ô | Ô | Ô | Ô |
ô | ô | ô | ô | ô |
Ù | Ù | – | Ù | Ù |
ù | ù | – | ù | ù |
Ż | – | ¯ | – | Ż |
ż | – | ¿ | – | ż |
Unicode – standard dla stron kaszubskojęzycznych (i nie tylko 🙂 ).
Obsługuje on wszystkie kaszubskie znaki (patrz: tabela pierwsza), co ułatwia pisanie jak i publikację stron internetowych.
Wszystkie przeglądarki od wersji 4.0 prezentuja kodowane w nim strony poprawnie. (*)
<!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8„>
</head>
</html>
Sam kod utf-8, dzięki pełnemu poparciu kaszubskich znaków, umożliwia ich późniejszą czytelną prezentację w sieci. Wielką jego zaletą jest też możliwość prezentacji stron w językach mieszanych, co w przypadku prac kaszuboznawczych (występujących m.in. w : polskim, niemieckim, czy też rosyjskim) wydaje się być kolejnym argumentem przemawiającym za nim.
Nie oznacza to jednak, ze nie można stosować alternatywnego zapisu z tabeli drugiej, czy też numerycznego zapisu utf-8 z tabeli pierwszej.
Od momentu pojawienia sie w sieci kaszubskiego edytora tekstów KaszED, publikowanie tekstów w języku kaszubskim przestało być „ekwilibrystyką”. Program ten umożliwia zapisywanie plików tekstowych w utf-8, które to można po zakończonej pracy najzwyczajniej w świecie „wkleić” do części kodu html.
3.Przykład
Chcecie na stronie kodowanej w utf-8, napisać : Naji ùczbë.
Początek
<!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>Tytuł</title>
<body>
Miejsce na wasz tekst: Naji ùczbë. (**)
</body>
</head>
</html>
Koniec strony
(*) To, że starsze (poniżej wersji 4.x) jak i tekstowe przeglądarki mają problemy w prezentacji stron kodowanych w utf-8, jest na pewno mankamentem, nie wolno jednak o tym zapomnieć, iż nie ma innej alternatywy na czytelne dla nich strony kaszubskojęzyczne.
(**) Nie oznacza to jednak, ze nie można stosować poniższych zapisów:
Naji ùczbë czy Naji ùczbë które to w przeglądarkach wyglądają jak „zwyczajnie” zapisany tekst.
Naji ùczbë – w html jak: Naji ùczbë
Naji ùczbë – w html jak: Naji ùczbë
III. ISO-8859-2 ( ISO – Latin – 2 )
Kod iso-8859-2 (zwany też iso-latin-2) nie zawiera wszystkich kaszubskich znaków (patrz: tabela pierwsza) , nie przedstawia to jednak wielkiego problemu w prezentacji kaszubskojęzycznych stron internetowych. Dzięki alternatywnemu zapisowi brakujących znaków (i nie tylko tych) można i w tym html-kodzie przedstawić poprawnie napisane strony kaszubskojęzyczne.
<!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-2„>
</head>
</html>
Koniec strony
a. Litery spójne z polskimi jak: ą, ł, ń, ó, ż – należy wpisać „normalnie” – z klawiatury
b. Kaszubskie „ogonki” – różniące się od polskich- jak: Ã, ã, É, é, Ë, ë, Ò, ò, Ù, ù jak i wspólną z polskim alfabetem literę Ó , ó.
zapiszcie w HTML tak jak w tabeli drugiej:
Tab. 2 – Alternatywny zapis kaszubskich „ogonków” w html.
à | à |
ã | ã |
É | É |
é | é |
Ë | Ë |
ë | ë |
Ò | Ò |
ò | ò |
Ó | Ó |
ó | ó |
Ù | Ù |
ù | ù |
Chcecie, na stronie kodowanej w iso-8859-2, napisac : Naji ùczbë
Początek już znacie
<!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-2″>
<title> Miejsce na tytuł waszej strony</title>
<body>
A tu na wasz tekst, którego zapis będzie wygladał następująco: Naji ùczbë.
</body>
</head>
</html>
Koniec strony
Uwaga ! ! !
Jak czytaliście wyżej (tabela pierwsza) część kaszubskich znaków jest zawarta w tabeli iso-8859-1 (ã, ò, ù) , poprzez to, a może i z innej przyczyny, tak zapisany tekst jest błednie itnterpretowany przez niektóre starsze przeglądarki.
Tak jest napewno z Netscapem i Operą niżej wersji 6.0 .
Zastępowanie znaków kaszubskich nie zawartych w iso-8859-2 zapisem numerycznym unicodu (pominąłem to celowo w tekście) niczego nie zmienia – takie strony są tak samo dla tych przeglądarek nieczytelne, jak te z „zapisem alternatywnym”.
Warto pamiętać !
1. Netscape 4x używany jest jeszcze przez niektórych internautów.
W związku z tym nie polecam publikacji stron kaszubskojęzycznych w kodzie iso-8859-2, jak i w iso-8859-1, którego możliwości zapisu tu celowo pominąłem, choć jest taki też możliwy (zastępowanie nie zawartych w danym kodzie znaków tymi z utf-8 wydaje mi się bardzo niespójne i nielogiczne). Podobnie ma się to też do Opery do wersji 5x.
2. Netscape 4x, 5x podobnie jak i w IE4x do IE 6.0 cechuje „problematyczna” kompatybilność ze standardami ustalonymi przez World Wide Web Consortium. Jedyny wyjątek z rodziny IE stanowi wersja 5.5 i to, żeby bylo śmieszniej, tylko i wyłącznie ta na MAC’a 🙂
Uwaga : Standardy są lepsze i nie są wymyślane w celu kopmlikacji, tylko ku poprawie komunikacji w sieci !!!