Philip Nunnegaard wrote:
> "MooreHojer" <simon@moorehojer.dk> skrev
>
>> ... og hvilken er den korrekte? Er det den jeg altid har fået at vide var
>> den korrekte eller er det w3c's default der er "rigtigt" at bruge?
>
> Jeg opfatter egentlig ikke den ene som mere rigtig end den anden.
> Problemet er dog at vores computere (Windows-maskiner) gerne gemmer tekst
> i ISO-8859-1, så det er man nødt til at fortælle browseren, der i
> udgangspunktet ikke kan se forskel.
Windows gemmer nu i UTF-16, siden Windows 2000 - før det havde 'han' noget
UCS2.
Men de første 256 codepoints i UTF-16 er de samme som i ISO-8859-1, så vi
(europæere) mærker ikke nogen forskel.
> Jeg vil tro (men her gætter jeg bare), at man skal bruge UTF-8, hvis man
> arbejder fra en linux-maskine.
Kun hvis den er sat op til UTF-8, min Linux kører med ISO-8859-1.
I forhold til MooreHojers:
> I dag skulle jeg så lige validere en side med w3c's validator men havde
> glemt at angive charset,og den faldt derfor tilbage på 'utf-8' og siden
> validerede så.
UTF-8 er et multibyte tegnsæt, hvor kun de første 128 tegn er repræsenteret
med én byte, se evt:
<
http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/iso_table.html>
fra 0 til og med 127(DEL).
De næste 128 tegn i denne tabel er delt op i 2 blokke á 64.
Første blok starter med chr(194) = Â efterfulgt af karakterværdien +128, og
næste blok starter med chr(195) = Ã efterfulgt af karakterværdien+128.
Det er årsagen til man ser de der mærkelige tegn, når man viser utf-8 i en
ansi editor.
Hvis den ovennævnte side ikke indeholdt tegn > 127, vil den validere både
som iso-8859-1 og som utf-8.
Hvad der er rigtigt eller ikke er vist mest en smagssag, så længe man ikke
bevæger sig ud i nogle mere 'eksotiske' tegn/sprog.
Skal man over i noget russisk m.v. er utf-8 nok det bedste valg.
Snakker man XML, var der i 'tidernes morgen' ikke understøttelse af
iso-8859-1, så der var utf-8, som er default i XML, en nødvendighed.
Det ser dog ud som selv 'en vis herre' til en vis grad understøtter
iso-8859-1 i XML.
--
Med venlig hilsen
Stig Johansen