Jørgen Farum Jensen skrev:
> Hvis du bruger charset utf-8 får du adgang til
> et større tegnsæt,
Jep.
> hvis du vel at mærke bruger html-tegnækvivalenter for hele det
> udvidede tegnsæt, herunder æøå og ÆØÅ.
Hvad for noget? Mener du at man skal skrive æ, ø og
å hvis man bruger utf-8? Det er ikke tilfældet - snarere
tværtimod. Med Latin-1 (iso-8859-1) har man direkte adgang til 256
tegn. I utf-8 er det tilsvarende tal 96447 (og standarden har plads
til mere end 800000 ekstra tegn hvis man finder på at lægge flere
ind).
Anvender man Latin-1 kan man fint skrive normale danske tekster
uden at bruge entiteter. Hvis man anvender utf-8, kan man i denne
samme tekst inkludere oversættelser på kinesisk, russisk og
japansk, benytte specielle matematiske tegn og meget andet sjov -
uden nogen form for specialkodning (man skal så bare have en editor
der kan finde ud af at skrive disse tegn).
Der hvor det imidlertid kan gå galt med utf-8 er hvis man siger man
anvender det uden at gøre det i virkeligheden. I modsætning til en
doctypeerklæring bliver en tegnsætserklæring (som regel) taget
alvorligt en en browser. De editorer jeg kender til, gemmer som
standard filer i Latin-1 (eller noget der minder om det - fx
windows-1252). Hvis man angiver iso-8859-1 som tegnsæt i html-
filen, behøver man derfor ikke at gøre mere for at det virker.
Omvendt er det ikke nok at skrive "utf-8" i tegnsætkoden for at
anvende utf - man skal også gemme filen i utf-8-tegnsættet. Gør man
ikke det, vil æøå vises forkert (medmindre man så konverterer dem
til html-entiteter). Ascii-tegn vises korrekt uanset om en Latin-1-
side fortolkes som utf-8 eller en utf-8-side fortolkes som Latin-1,
af den simple grund at begge tegnsæt repræsenterer de 128 ascii-
tegn helt ens.
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på
http://usenet.dk/netikette/citatteknik.html