/ Forside / Teknologi / Udvikling / Perl / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Perl
#NavnPoint
bjarneA 141
poul_from 50
soccer 30
Nicknack 14
Tmpj 0
XML::Parser - danske tegn
Fra : Thomas Rokamp


Dato : 14-12-00 13:53

Hejsa!

Jeg roder lidt rundt med noget XML, og er stødt på det problem at danske
tegn som æ, ø og å ikke kan vises korrekt. De vises hver i sær som to tegn
sat sammen (nogle mærkelige nogen)...

Jeg har forsøgt at bruge både
<?xml version='1.0' encoding='ISO-8859-1'?>

og
parse($xml, ProtocolEncoding => 'ISO-8859-1');

Men intet af det hjælper.

Hvis jeg slet ikke angiver noget encoding, får jeg fejl i perl :
"not well-formed at line 10, column 43, byte 345 at
C:/Perl/site/lib/XML/Parser.pm line 168"

Håber der er nogen der kender løsningen?

Med venlig hilsen,

Thomas Rokamp



 
 
Thomas Martin Widman~ (14-12-2000)
Kommentar
Fra : Thomas Martin Widman~


Dato : 14-12-00 14:15

"Thomas Rokamp" <crax@mail.com> writes:

> Jeg roder lidt rundt med noget XML, og er stødt på det problem at danske
> tegn som æ, ø og å ikke kan vises korrekt. De vises hver i sær som to tegn
> sat sammen (nogle mærkelige nogen)...

Jeg kender ikke løsningen, men det kunne lyde som om, æ, ø og å parses
korrekt, oversættes korrekt til Unicode, men ikke oversættes tilbage
til 8859-1, når du skal se resultatet. Muligvis skal du kalde en form
for Unicode->Latin1-filter efter parsning?

/Thomas
--
Thomas M Widmann | Master's Student | Programmer | Uni-parken 8, 2. v.333
viralbus@daimi.au.dk|Ling. & Comp. Sci.| Stibo DS | DK-8000 Århus C, Danio
+45 21 67 61 27 |Aarhus Universitet|tmw@ccieurope.com | President/DK-TUG
<URL:http://www.daimi.au.dk/~viralbus> | +45 87 33 44 65 / T4ONF/TÅGEKAMMERET

Thorbjørn Ravn Ander~ (15-12-2000)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 15-12-00 09:16

Thomas Rokamp wrote:
>
> Hejsa!
>
> Jeg roder lidt rundt med noget XML, og er stødt på det problem at danske
> tegn som æ, ø og å ikke kan vises korrekt. De vises hver i sær som to tegn
> sat sammen (nogle mærkelige nogen)...

XML::Parser giver dig data i UTF-8 format. Perl 5.6 kan konvertere fra
UTF-8 til ISO-Latin.

Ellers kan en tilstrækkelig ny version af XML::Parser give dig det
oprindelige indhold fra parseren.

Efter at have rodet en del med XML i Perl og Java, er min konklusion at
Perl endnu ikke er på højde med Java med hensyn til Unicode og
XML-behandling.
--
Thorbjørn Ravn Andersen "...sound of...Tubular Bells!"
http://bigfoot.com/~thunderbear

Lars Balker Rasmusse~ (17-12-2000)
Kommentar
Fra : Lars Balker Rasmusse~


Dato : 17-12-00 13:09

Thorbjørn Ravn Andersen <thunderbear@bigfoot.com> writes:
> Efter at have rodet en del med XML i Perl og Java, er min konklusion at
> Perl endnu ikke er på højde med Java med hensyn til Unicode og
> XML-behandling.

BUUURN THE HERETIC!

Hmmm.
--
Lars Balker Rasmussen "Woo hoo!?"

Thorbjørn Ravn Ander~ (18-12-2000)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 18-12-00 09:28

Lars Balker Rasmussen wrote:
>
> Thorbjørn Ravn Andersen <thunderbear@bigfoot.com> writes:
> > Efter at have rodet en del med XML i Perl og Java, er min konklusion at
> > Perl endnu ikke er på højde med Java med hensyn til Unicode og
> > XML-behandling.
>
> BUUURN THE HERETIC!

Ups...

use XML::Parser;END{$?=0};new XML::Parser(Handlers,{Char,sub{@n=
shift->context;$n[-1].=pop;die"@n\n"}})->parse(<DATA>);__END__
<Just><another><XML><hacker>,&#</hacker></XML></another></Just>


Er det bedre nu?

--
Thorbjørn Ravn Andersen "...sound of...Tubular Bells!"
http://bigfoot.com/~thunderbear

Mads Toftum (18-12-2000)
Kommentar
Fra : Mads Toftum


Dato : 18-12-00 20:13

On 17 Dec 2000 13:08:53 +0100, Lars Balker Rasmussen <lars@balker.org>
wrote:

>BUUURN THE HERETIC!

Det var måske en ide at få indkaldt til krisemøde i aarhus.pm.org så
vi kan så sat ild til formanden ASAP?


vh

Mads Toftum, QDPH
som på USENET repræsenterer sig selv og ingen andre.

Lars Balker Rasmusse~ (18-12-2000)
Kommentar
Fra : Lars Balker Rasmusse~


Dato : 18-12-00 21:51

Mads Toftum <mt@dev.null> writes:
> On 17 Dec 2000 13:08:53 +0100, Lars Balker Rasmussen <lars@balker.org>
> wrote:
> >BUUURN THE HERETIC!
>
> Det var måske en ide at få indkaldt til krisemøde i aarhus.pm.org så
> vi kan så sat ild til formanden ASAP?

Ja. En god gang whisky til alle medlemmer og nogle tændstikker kan
sikkert få fut i diskussionen.
--
Lars Balker Rasmussen "Woo hoo!?"

Thorbjørn Ravn Ander~ (19-12-2000)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 19-12-00 11:00

Mads Toftum wrote:

> >BUUURN THE HERETIC!
>
> Det var måske en ide at få indkaldt til krisemøde i aarhus.pm.org så
> vi kan så sat ild til formanden ASAP?

Er det et mytteri eller en opfordring?

--
Thorbjørn Ravn Andersen "...sound of...Tubular Bells!"
http://bigfoot.com/~thunderbear

Mads Toftum (19-12-2000)
Kommentar
Fra : Mads Toftum


Dato : 19-12-00 16:13

On Tue, 19 Dec 2000 10:59:40 +0100, Thorbjørn Ravn Andersen
<thunderbear@bigfoot.com> wrote:

>Er det et mytteri eller en opfordring?

Det er jo i virkeligheden et godt spørgsmål ...
Men forslaget om whiskey og tændstikker lyder da absolut "interessant"
... om ikke andet så kunne det vel føre til en noget ophedet
diskussion.


vh

Mads Toftum, QDPH
som på USENET repræsenterer sig selv og ingen andre.

Thomas Rokamp (18-12-2000)
Kommentar
Fra : Thomas Rokamp


Dato : 18-12-00 17:08

> XML::Parser giver dig data i UTF-8 format. Perl 5.6 kan konvertere fra
> UTF-8 til ISO-Latin.
>

Kan du give et eksempel?

Jeg er helt ny i XML...

Mvh.
Thomas Rokamp



Thorbjørn Ravn Ander~ (19-12-2000)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 19-12-00 10:19

Thomas Rokamp wrote:
>
> > XML::Parser giver dig data i UTF-8 format. Perl 5.6 kan konvertere fra
> > UTF-8 til ISO-Latin.
> >
>
> Kan du give et eksempel?
>
> Jeg er helt ny i XML...

Jaaah. I Perl 5.6 (hvor jeg har rodet med det) er det beskrevet i
"perldoc perlop" under forklaringen på "tr" (eller "y") operatoren.

Deres eksempel er

tr/\0-\x{FF}//UC; # change Unicode to Latin-1

Det skal du "bare" have siddende inden i din Char handler (hvis det er
det du bruger).

--
Thorbjørn Ravn Andersen "...sound of...Tubular Bells!"
http://bigfoot.com/~thunderbear

Søg
Reklame
Statistik
Spørgsmål : 177547
Tips : 31968
Nyheder : 719565
Indlæg : 6408797
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste