"Peter Brodersen" <usenet2006@ter.dk> wrote in message
news:el866t$diq$1@news.klen.dk...
> On Wed, 6 Dec 2006 19:38:42 +0100, "Jonas Delfs"
> <jonas@NOSPAMdelfs.dk> wrote:
>
>>Jeg sidder og skal fiske noget tekst ud af noget HTML. Jeg bruger noget a
>>la
>>preg_match_all('/<h2>([^<]+)<\/h2>/', $string, $matches), men danske tegn
>>(æøå) optræder som mærkelige tegn (ø fx som Ã~) i mit $matches array
>>bagefter.
>
> Den tekst, du henter fra, er sandsynligvis i UTF-8-format i første
> omgang. Det har næppe noget med preg-funktionen at gøre.
$string kommer fra file_get_contents('
http://domain.com/file.html');
> Prøv bare at printe den hentede tekst ud i første omgang, og se om æøå
> ikke også er anderledes dér.
echo $string; virker fint, men den indeholder måske også informationer om at
det skal vises i UTF-8-format, ud fra ovenstående?
> Du kan eventuelt konvertere $string ved hjælp af funktionen
> utf8_decode()
Med utf8_decode() vises æøå som et spørgsmålstegn?
Mvh. Jonas