|
| TNMHTTP og bogstaver... Fra : jodleren |
Dato : 28-03-05 11:33 |
|
Hejsa!
Jeg bruger TNMHTTP.Get(adr) til at hente noget information fra nettet -
som sådan ikke noget problem, men med nogle bogstaver går det galt.
En del er &aauml; og å osv.
Men nogle kommer i et "to-tegns-format":
9985807286 (köites) -> 9985807286 (köites)
tõlkinud Heli Greenbaum -> tõlkinud Heli Greenbaum
Ãœhiselu -> ühiselu või Ühiselu.
De bygynder alle med à - så der er til at finde. Men kender nogen til
dette format???
| |
Finn Bindeballe (28-03-2005)
| Kommentar Fra : Finn Bindeballe |
Dato : 28-03-05 17:27 |
|
hep...
det er sansynligvis unicode du er stødt paa....
jeg er ikke expert i Html, men i XML skal der staa, hvilket karaktersæt
der er anvendt. Det vil jeg tro der ogsaa staar i Html...
du kan læse mere om det her....
http://fundementals.sourceforge.net/unicode.html
/f
| |
Niels Martin Hansen (29-03-2005)
| Kommentar Fra : Niels Martin Hansen |
Dato : 29-03-05 18:40 |
|
jodleren wrote:
> 9985807286 (köites) -> 9985807286 (köites)
> tõlkinud Heli Greenbaum -> tõlkinud Heli Greenbaum
> Ãœhiselu -> ühiselu või Ühiselu.
>
> De bygynder alle med à - så der er til at finde. Men kender nogen til
> dette format???
Det er UTF-8 kodningen, til kodning af Unicode tegnsættet. I UTF-8
bliver et bogstav/tegn indkodet med mellem 1 og 4 bytes. F.eks. tager et
tegn fra det engelske alfabet (A-Z) og resten af de 127 første tegn i
ASCII 1 byte i UTF-8, de fleste specialtegn der bruges i europæiske
sprog tager 2 byte i UTF-8, og øskasiatiske skrifttegn tager typisk 3
eller 4 byte i UTF-8.
Hvis du er sikker på du kun vil støde på vesteuropæiske tegn, kan du
bruge funktionen Utf8ToAnsi. Den findes i hvert fald i min Delphi 6
Personal.
/Niels
| |
|
|