/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Hvilket tegnsæt?
Fra : Jacob Tranholm


Dato : 22-03-05 01:21

Igennem mange år har jeg anvendt ISO-8859-1 som standard tegnsæt på mine
computere, men i forbindelse med en konvertering af nogle filer fra UTF-8
til ISO-8859-1 kom jeg til at læse lidt mere om unicode. - Og en hel del af
argumenterne for anvendelse af unicode lyder faktisk meget fornuftige...

I denne nyhedsgruppe antager jeg, at en del af deltagerne faktisk har en
baggrund som systemadministratorer; og spørgsmålet er derfor:

Hvilket tegnsæt er det mest hensigsmæssigt at anvende i Danmark?

Spørgsmålet gælder for både servere og arbejdsstationer.


 
 
Klaus Ellegaard (22-03-2005)
Kommentar
Fra : Klaus Ellegaard


Dato : 22-03-05 06:49

Jacob Tranholm <jacob_tranholm@hotmail.com> writes:
>I denne nyhedsgruppe antager jeg, at en del af deltagerne faktisk har en
>baggrund som systemadministratorer; og spørgsmålet er derfor:
>
>Hvilket tegnsæt er det mest hensigsmæssigt at anvende i Danmark?

ISO-8859-1.

Der er alt for meget derude, der ikke kan overskue UTF-8, så
medmindre man er sikker på, at alverdens kunder og emner har
support for andet, er ISO-8859-1 stadig vejen frem.

Godt nok mangler -1 et euro-tegn, og det kan være et udmærket
argument for at skifte til -15. Fordelen er, at praktisk talt
alle tegn er ens mellem de to, så selvom en klient ikke kan
-15, vil indholdet stadig kunne læses. Med undtagelse af
Euro-tegnet. Det vil typisk blive erstattet med et ? eller .

Risikoen ved -15 er gamle klienter, der ikke forstår -15. De
vil i nogle tilfælde råbe op om, at denne mail (eller hvad det
nu er) er skrevet i et mærkeligt tegnsæt og måske ikke kan
læses. Om man vil prøve alligevel og håbe det bedste?

Jeg ser flere og flere websites, hvor indholdet er UTF-8, men
hvor Content stadig specificerer ISO-8859-1. Det giver det
kendte dobbelt-snask i stedet for æøå, og det ser skrækkeligt
ud. Det ville være kedeligt at sende den slags til kunder -
uanset at ens materiale overholder alle standarder i den
sammenhæng.

ISO-8859-1 er nok den mest udbredte extension ovenpå ASCII,
og ASCII har haft 37 år til at blive totalt indgroet overalt.
UTF-8 har heldigvis set lyset og er ASCII-kompatibel, men når
man har brug for danske bogstaver, så snakker vi sikkert om
op mod 10 år endnu, før UTF-8 har nået en rimelig udbredelse.

Mvh.
   Klaus.

Anders Jensen (22-03-2005)
Kommentar
Fra : Anders Jensen


Dato : 22-03-05 15:00

Jeg har lige et spørgsmål i samme katagori.

Emnet om tegnsæt, fik mig lige til at indsætte følgende:

/etc/login.conf:
:charset=UTF-8:\
:lang=da_DK.UTF-8:\

Når jeg tager en SSH til min FreeBSD, så kan jeg godt skrive "æøå" i
prompten, men hvis jeg tager en directory listning over nogle filer,
skrevet fra en Windows maskine (over et Samba share), så skriver den
bare "?" ved de danske tegn. Hvis jeg ser filerne fra min Windows, ser
de fine ud.

Er det min Samba den er gal med (den har jeg ikke pillet ved endnu)? Jeg
kan jo ikke helt se, hvad den har med filerne at gøre eftersom det er
lokale filer på disken, men måske er filerne blevet gemt "forkert"?

-bash-3.00$ echo æøå
æøå

-bash-3.00$ ls -l
-rwxrw-r-- 1 me wheel 20778 15 Maj 2001 S?rens ?leruse.txt

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste