Witaj Gościu Zaloguj się lub zarejestruj się.
Zaloguj

ISO-8859-2 vs. UTF-8. Standardy kodowania nowoczesnych witryn

ISO-8859-2 vs. UTF-8. Standardy kodowania nowoczesnych witryn

Tworząc witryny dla polskich Klientów, trudno jest pominąć kodowanie znaków. Nasz język posiada znaki specjalne, które często sprawiają problemy początkującym (i nie tylko) webmasterom.

Jaki jest więc najbardziej odpowiedni standard kodowania nowoczesnych witryn? Dowiedz się od najlepszych.

Nieco historii

Na samym początku, gdy powstała pierwsza witryna internetowa, nikt nie zastanawiał się nad kodowaniem znaków w innych językach. Pierwsza strona internetowa została stworzona przez Tima Berners-Lee (Anglik). W jego języku nie występują takie znaki, jak ąęśćź itp.

Problem kodowania nie powstał przy pierwszej witrynie internetowej, lecz już wcześniej. Rozwiązań pojawiło się wiele i dały one bardzo różne efekty.

Niestety smutną prawdą jest to, że większość skryptów, narzędzi, szablonów itp. powstaje w anglojęzycznych krajach. Ludzie w nich mieszkający nie stykają się na co dzień z problemem tzw. "krzaczków". Z tego właśnie powodu większość z nich nie zwraca uwagi na takie "drobnostki". Tylko nieliczni starają się tworzyć uniwersalne rozwiązania. Co zrobić, gdy na naszej stronie pełno "krzaczorów"?


Standardy kodowania

W wyniku wielu prac różnych grup powstało kilka kodowań. Zależnie od założeń, standardy kodowania zawierały różne zestawy znaków. Choć jest ich sporo, przedstawię 2 najpopularniejsze, które zawierają polskie znaki specjalne.

Windows 1250

Nie wiem nawet, czy można to nazwać standardem. Został wymyślony przez dobrze wszystkim znaną firmę Microsoft. Nie trudno się domyśleć, że jest on używany tylko i wyłączenie systemach Windows - to pułapka. Początkujący użytkownicy włączają swoje witryny stworzone w notatniku (który domyślnie korzysta z tego kodowania) i wszystko pięknie działa. Nie są oni jednak świadomi, że na innych systemach występują krzaczki.

Mógłbyś powiedzieć, że ten "standard" kodowania nic pozytywnego nie wprowadził do świata tworzenia witryn WWW. Wymieniłem go tutaj jednak jako przestrogę dla nowicjuszy, którzy uczą się z przypadkowych kursów z Internetu. Windows-1250 to najgorszy wybór!


ISO-8859-2 (Latin 2)

Jest to druga część standardu 8859, która zawiera 191 znaków łacińskiego pisma. Jest ono również znane jako środkowo- i wschodnioeuropejskie. Jakie są więc jego wady i zalety?

Zalety Wady
  • Powodował i powoduje nadal wiele problemów związanych z kodowaniem znaków podczas pisania stron. Niektóre aplikacje go nie obsługują i nie potrafią w tej specyfikacji zapisywać plików
  • Małe wsparcie w skryptach - większość skryptów JavaScript wykonujących akcje na tekstach nie obsługuje tego kodowania, czego wynikiem są krzaczki.
  • Posiada ograniczony zestaw obsługiwanych znaków - jak wspomniałam w zaletach, obsługuje on sporą część znaków potrzebnych do pisania witryn w różnych językach. Zestaw ten jest jednak stosunkowo ograniczony.

UTF-8

Najnowszy z tych trzech, który powstał po to, aby rozwiązać wszystkie problemy i wady, które posiadały dwa poprzednie oraz inne niewymienione. Zawiera on wszystkie znaki potrzebne do wyświetlenia tekstu w dowolnym języku na świecie. Jakie są jego zalety i wady?

Zalety
  • Obsługuje wszystkie języki już nie musisz się martwić tym, czy strona, którą tworzysz będzie tłumaczona na język niemiecki, rumuński, holenderski czy czeski.
  • Wszystkie aplikacje go obsługują - na rynku nie ma profesjonalnej aplikacji, która by nie obsługiwała tego standardu kodowania do zapisywania plików
  • Domyślny przy wielu aplikacjach - w przeciwieństwie do ISO, UTF-8 jest ustawione jako domyślne kodowanie przy zapisie plików w większości aplikacji.
  • Obsługa wielu skryptów - skrypty JavaScript operujące na tekstach nie mają najmniejszych problemów z wyświetlaniem tekstów w dowolnym języku.
  • Ogromny zakres znaków - UTF-8 zawiera nie tylko znaki diakrytyczne, lecz także inne, które bywają przydatne przy witrynach internetowych - strzałki, serduszka i wiele więcej.
  • Wsparcie AJAX - jest to jedyne kodowanie wspierane przez technologię AJAX.
Wady
  • Rozmiar - każdy znak łaciński w tym kodowaniu zajmuje dwa, zamiast jednego bajta
  • Problemy z BOM - niektóre aplikacje (jak np. notatnik systemu Windows) umożliwia zapisywanie plików jedynie za pomocą UTF-8 z BOM.

Osobiście uważam, że jest to jedynie słuszne kodowanie dla nowoczesnych witryn internetowych. Jest on następcą ISO i rozwiązuje wszystkie jego problemy niskim kosztem (znaki łacińskie zajmują 2 zamiast 1 bajta).


Prognoza na przyszłość

Na dzień pisania tego wpisu, statystyki wskazują, że tylko 0,5 % witryn korzysta z kodowania ISO-8859-2, ntomaist z UTF-8 aż 74,2 % (źródło: http://w3techs.com). Drugi ważny aspekt przy statystykach jest taki, że tendencja dla ISO jest spadkowa natomiast dla UTF-8 wzrostowa. Ostatecznie oznacza to, że wsparcie i tak niewielkiej ilości skryptów dla tego kodowania niedługo spadnie do zera.

Powód stworzenia wpisu (podsumowanie)

Wpis ten powstał dla ludzi, którzy zaczynają swoją przygodę w świecie projektowania witryn, chcą się dowiedzieć, jak wygląda sytuacja w tematyce kodowań witryn na dzień dzisiejszy oraz dla upartych webmasterów, którzy uważają, że kodowanie ISO to jedynie słuszne. Wielu z nich pyta użytkowników UTF-8 dlaczego go używają. Pytanie powinno być odwrotne - skoro mamy kodowanie, które jest bardziej uniwersalne, skutkuje mniejszą ilością problemów/błędów i jest standardem światowym, to dlaczego go nie używać? Standard ISO nie ma w sobie niczego interesującego poza obsługą łacińskich znaków za pomocą jednego bajta - mimo tego, w dzisiejszym świecie super-wydajnych serwerów i komputerów - czy to takie ważne? Zaprasam was do komentowania i dzielenia się swoją opinią w tym temacie ;)

Inne wpisy, które mogą Cię zainteresować

Poniżej przedstawiamy Ci propozycje innych wpisów, które mogą Cię zainteresować. Sprawdź, czytaj i poszerzaj swoją wiedzę.


Czytaj
Szewc bez butów chodzi... A Ty?

Szewc bez butów chodzi... A Ty?

Czytaj
Kurs Photoshop już tu jest!

Kurs Photoshop już tu jest!

Czytaj
Pytanie od czytelnika:

Pytanie od czytelnika: "Czy powinienem pracować za darmo?"

Czytaj
Internet przestał działać, czyli praca Freelancera off-line

Internet przestał działać, czyli praca Freelancera off-line

Komentarze do tego wpisu


comments powered by Disqus
Regulamin serwisu | Polityka prywatności | Polityka plików "cookies"

Materiały zamieszczone na niniejszej stronie są właśnością firmy Fuertigo Justyna Słobodzian lub firma posiada na nie odpowiednie licencje. Zabrania się kopiowania, modyfikowania oraz rozpowszechniania wszelkich materiałów znajdujących się na stronie bez pisemnej listownej zgody właściciela. Wyjątkiem są materiały, przy których widnieje inna informacja.