/ Forside / Teknologi / Udvikling / PHP / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
PHP
#NavnPoint
rfh 3959
natmaden 3372
poul_from 3310
funbreak 2700
stone47 2230
Jin2k 1960
Angband 1743
Bjerner 1249
refi 1185
10  Interkril.. 1146
kontrol af data
Fra : Mickey


Dato : 01-12-01 20:38

Er der nogen der kan komme med en metod til at skrive hjemmesideadresser der
ikke fange af denne eregi test ?

[a-z0-9]?\.[a-z0-9]*\.[a-z0-9]{1,3}

- bemærk, det er eregi, altså case insensitive!

Jeg kan kun selv komme på f.eks. at skrive IP adressen som heltal, altså et
langt tal...

--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


 
 
Morten Poulsen (01-12-2001)
Kommentar
Fra : Morten Poulsen


Dato : 01-12-01 21:12

In article <9ubbi1$vrt$1@egon.worldonline.dk>, "Mickey" <news002@susie.dk>
wrote:
> Er der nogen der kan komme med en metod til at skrive hjemmesideadresser
> der ikke fange af denne eregi test ?
>
> [a-z0-9]?\.[a-z0-9]*\.[a-z0-9]{1,3}

Jeg gaar ud fra et det kun er hostnavnet du er ude efter.

De her matcher saa vidt jeg kan se ikke
- aa.dinmor.dk
- a.b.dinmor.dk
- www.dinmor.dk.

mvh
Morten

Mickey (01-12-2001)
Kommentar
Fra : Mickey


Dato : 01-12-01 22:26

"Morten Poulsen" <morten@flug.dk> skrev i en meddelelse
news:pan.2001.12.01.21.12.12.18.3801@flug.dk...

> Jeg gaar ud fra et det kun er hostnavnet du er ude efter.

det skulle jeg nok ha skrevet - ja, det er kun det efter http:// (bruger
[h|f]tt?ps?:// til at checke for ftp eller http(s))

> - aa.dinmor.dk

den gør

> - a.b.dinmor.dk

den gør også

> - www.dinmor.dk.

og den gør også...


--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Morten Bakkedal (02-12-2001)
Kommentar
Fra : Morten Bakkedal


Dato : 02-12-01 11:41

Mickey wrote:

> det skulle jeg nok ha skrevet - ja, det er kun det efter http:// (bruger
> [h|f]tt?ps?:// til at checke for ftp eller http(s))

ftps?

--
Morten Bakkedal
http://bakkeland.dk/



Hroi Sigurdsson (02-12-2001)
Kommentar
Fra : Hroi Sigurdsson


Dato : 02-12-01 17:24

Mickey wrote:

> det skulle jeg nok ha skrevet - ja, det er kun det efter http:// (bruger
> [h|f]tt?ps?:// til at checke for ftp eller http(s))

(ftp|https?):// matcher mere præcist.
Jeg har aldrig hørt om fttp, ftps, fttps, htp eller htps

--
Hroi Sigurdsson hroi@asdf.dk
Danske nyhedsfeeds i RSS-format: http://asdf.dk/rss/da/

Thomas Jensen - pil.~ (02-12-2001)
Kommentar
Fra : Thomas Jensen - pil.~


Dato : 02-12-01 18:22

On Sun, 02 Dec 2001 17:24:17 +0100, Hroi Sigurdsson <hroi@asdf.dk>
wrote:

>Jeg har aldrig hørt om fttp, ftps, fttps, htp eller htps

du har heller aldrig arbejdet i en stor organisation m. egen
marketingafdeling har du?

--
med venlig hilsen
Thomas Jensen
http://pil.dk/nyhedsbreve/2001oktober.php

Kim Emax - ayianapa.~ (02-12-2001)
Kommentar
Fra : Kim Emax - ayianapa.~


Dato : 02-12-01 18:28


"Thomas Jensen - pil.dk" <tj@dev.null> skrev

> du har heller aldrig arbejdet i en stor organisation m. egen
> marketingafdeling har du?

*LOL* Tænker du på www.adsl.worldonline.dk?

--
Take Care
Kim Emax
http://www.emax.dk
http://www.ayianapa.dk
http://www.artificial-dreams.dk
Køb din vin online på http://www.gmvin.dk,
Danmarks mest avancerede VinWebShop



Thomas Jensen - pil.~ (02-12-2001)
Kommentar
Fra : Thomas Jensen - pil.~


Dato : 02-12-01 18:34

On Sun, 2 Dec 2001 18:28:28 +0100, "Kim Emax - ayianapa.dk"
<newsgroup@sletdette-ayianapa.dk> wrote:

>
>"Thomas Jensen - pil.dk" <tj@dev.null> skrev
>
>> du har heller aldrig arbejdet i en stor organisation m. egen
>> marketingafdeling har du?
>
>*LOL* Tænker du på www.adsl.worldonline.dk?

faktisk ikke nej... en endnu større organisation

--
med venlig hilsen
Thomas Jensen
http://pil.dk/nyhedsbreve/2001oktober.php

Hroi Sigurdsson (02-12-2001)
Kommentar
Fra : Hroi Sigurdsson


Dato : 02-12-01 19:37

"Thomas Jensen - pil.dk" wrote:

> du har heller aldrig arbejdet i en stor organisation m. egen
> marketingafdeling har du?

Jeg *er* i marketingafdelingen

--
Hroi Sigurdsson hroi@asdf.dk
Danske nyhedsfeeds i RSS-format: http://asdf.dk/rss/da/

Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 18:29

"Hroi Sigurdsson" <hroi@asdf.dk> skrev i en meddelelse
news:3C0A55B1.F5E7E279@asdf.dk...

> (ftp|https?):// matcher mere præcist.
> Jeg har aldrig hørt om fttp, ftps, fttps, htp eller htps

nej, men folk skriver ikke altid helt korrekt ;)
- spøg til side, jeg tror effekten er ca. den samme...


--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Nezar Nielsen (01-12-2001)
Kommentar
Fra : Nezar Nielsen


Dato : 01-12-01 23:53

"Mickey" <news002@susie.dk> wrote in message
news:9ubbi1$vrt$1@egon.worldonline.dk...
> Er der nogen der kan komme med en metod til at skrive hjemmesideadresser
der
> ikke fange af denne eregi test ?
>
> [a-z0-9]?\.[a-z0-9]*\.[a-z0-9]{1,3}

fez.dk

dk. (men dem findes der ik så mange af ;))

og så går jeg ud fra at du mener hostnavne..?

--
Mvh. Nezar Nielsen
http://fez.dk/




Thomas Jensen (02-12-2001)
Kommentar
Fra : Thomas Jensen


Dato : 02-12-01 02:57

"Mickey" <news002@susie.dk> wrote in
news:9ubbi1$vrt$1@egon.worldonline.dk:

> Er der nogen der kan komme med en metod til at skrive
> hjemmesideadresser der ikke fange af denne eregi test ?
>
> [a-z0-9]?\.[a-z0-9]*\.[a-z0-9]{1,3}
>
> - bemærk, det er eregi, altså case insensitive!
>
> Jeg kan kun selv komme på f.eks. at skrive IP adressen som heltal,
> altså et langt tal...

Der er problmer med alle hostnames med kun en punktum, f.eks.
obscure.dk

derudover er TLD'er ikke begrænset til tre bogstaver, f.eks.
minnesota.science.museum

Eller hvad med: a.b.c.d.e.obscure.mine.nu

Det er ikke super gennemtestet, men hvad med den her:
^([a-z0-9-]+\.)+([a-z0-9-]+)$

--
mvh
Thomas Jensen

Hroi Sigurdsson (02-12-2001)
Kommentar
Fra : Hroi Sigurdsson


Dato : 02-12-01 10:42

Thomas Jensen wrote:

> Der er problmer med alle hostnames med kun en punktum, f.eks.
> obscure.dk

Eller uden: http://dk/ (http://dk./)

hroi@sleepy ~ > host dk.
dk has address 194.192.186.150

Indrømmet, grænsetilfælde.

> derudover er TLD'er ikke begrænset til tre bogstaver, f.eks.
> minnesota.science.museum
>
> Eller hvad med: a.b.c.d.e.obscure.mine.nu
>
> Det er ikke super gennemtestet, men hvad med den her:
> ^([a-z0-9-]+\.)+([a-z0-9-]+)$

Det er vist tilladt at have punktum til sidst.

--
Hroi Sigurdsson hroi@asdf.dk
Danske nyhedsfeeds i RSS-format: http://asdf.dk./rss/da/

Thomas Jensen (02-12-2001)
Kommentar
Fra : Thomas Jensen


Dato : 02-12-01 12:09

Hroi Sigurdsson <hroi@asdf.dk> wrote in news:3C09F760.7518FFC4@asdf.dk:

>> Det er ikke super gennemtestet, men hvad med den her:
>> ^([a-z0-9-]+\.)+([a-z0-9-]+)$
>
> Det er vist tilladt at have punktum til sidst.

^([a-z0-9-]+\.)+([a-z0-9-]+)\.?$

?

--
mvh
Thomas Jensen

Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 19:12

"Hroi Sigurdsson" <hroi@asdf.dk> skrev i en meddelelse
news:3C09F760.7518FFC4@asdf.dk...

> Eller uden: http://dk/ (http://dk./)

de to der fanges pga. http:// sekvensen...

- men ellers ikke...


--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 19:16

"Thomas Jensen" <thomasNO@SPAM.obscure.dk> skrev i en meddelelse

> Der er problmer med alle hostnames med kun en punktum, f.eks.
> obscure.dk

ov ja...

> derudover er TLD'er ikke begrænset til tre bogstaver, f.eks.
> minnesota.science.museum

hmmm

> Eller hvad med: a.b.c.d.e.obscure.mine.nu

den fanges - der er jo en sekvens med tegn.tegn.12(3)

> Det er ikke super gennemtestet, men hvad med den her:
> ^([a-z0-9-]+\.)+([a-z0-9-]+)$

den prøver jeg lige...

- den giver problemer i den der form, sagen er nemlig at den skal bruges
til at kontrollere at det _ikke_ skrives adresser på hjemmesider i en tekst
til et net-forum... Hvis jeg fjerner ^ og $ virker den tilsyneladene med
alle de forskellige test-forslag

--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Nezar Nielsen (02-12-2001)
Kommentar
Fra : Nezar Nielsen


Dato : 02-12-01 19:58

"Mickey" <news002@susie.dk> wrote in message
news:9udr52$ogm$1@egon.worldonline.dk...
> > Det er ikke super gennemtestet, men hvad med den her:
> > ^([a-z0-9-]+\.)+([a-z0-9-]+)$
>
> den prøver jeg lige...
>
> - den giver problemer i den der form, sagen er nemlig at den skal bruges
> til at kontrollere at det _ikke_ skrives adresser på hjemmesider i en
tekst
> til et net-forum... Hvis jeg fjerner ^ og $ virker den tilsyneladene med
> alle de forskellige test-forslag

Så vil "manden vejede 80.04 kg" vel fejle.

Jeg kan ikke helt huske forkortelses-reglerne, men er der ikke noget om at
man godt kan skrive "bl.a" eller "v.hj.a"...

--
Mvh. Nezar Nielsen
http://fez.dk/




Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 20:08

"Nezar Nielsen" <tumpen@fez.dk> skrev i en meddelelse
news:ZVuO7.1009$z4.157495@news000.worldonline.dk...

> Så vil "manden vejede 80.04 kg" vel fejle.
>
> Jeg kan ikke helt huske forkortelses-reglerne, men er der ikke noget om at
> man godt kan skrive "bl.a" eller "v.hj.a"...

bl.a. og vha mener jeg ;)

- men anyway, shit os, hva gør jeg så ?

--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Hroi Sigurdsson (02-12-2001)
Kommentar
Fra : Hroi Sigurdsson


Dato : 02-12-01 20:24

Mickey wrote:

> "Nezar Nielsen" <tumpen@fez.dk> skrev i en meddelelse
> news:ZVuO7.1009$z4.157495@news000.worldonline.dk...
>
> > Så vil "manden vejede 80.04 kg" vel fejle.
> >
> > Jeg kan ikke helt huske forkortelses-reglerne, men er der ikke noget om at
> > man godt kan skrive "bl.a" eller "v.hj.a"...
>
> bl.a. og vha mener jeg ;)
>
> - men anyway, shit os, hva gør jeg så ?

Så tjekker du først for disse undtagelser.

--
Hroi Sigurdsson hroi@asdf.dk
Danske nyhedsfeeds i RSS-format: http://asdf.dk/rss/da/

Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 21:06

"Hroi Sigurdsson" <hroi@asdf.dk> skrev i en meddelelse
news:3C0A7FD1.8D1F7D33@asdf.dk...

> Så tjekker du først for disse undtagelser.

du mener, jeg checker hele listen over danske forkortelser ?

--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Hroi Sigurdsson (02-12-2001)
Kommentar
Fra : Hroi Sigurdsson


Dato : 02-12-01 21:16

Mickey wrote:

> > Så tjekker du først for disse undtagelser.
>
> du mener, jeg checker hele listen over danske forkortelser ?

Ja. Kan du se nogen omvej?

--
Hroi Sigurdsson hroi@asdf.dk
Danske nyhedsfeeds i RSS-format: http://asdf.dk/rss/da/

Mickey (02-12-2001)
Kommentar
Fra : Mickey


Dato : 02-12-01 22:24

"Hroi Sigurdsson" <hroi@asdf.dk> skrev i en meddelelse
news:3C0A8BF2.914C3DA6@asdf.dk...

> Ja. Kan du se nogen omvej?

omvej ?
- men nej, jeg kan ikke liiiige se nogen bedre måde, må nok nøjes med at
checke på http:// og ftp://


--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Kim Petersen (03-12-2001)
Kommentar
Fra : Kim Petersen


Dato : 03-12-01 05:57

"Mickey" <news002@susie.dk> writes:

> Er der nogen der kan komme med en metod til at skrive hjemmesideadresser der
> ikke fange af denne eregi test ?
>
> [a-z0-9]?\.[a-z0-9]*\.[a-z0-9]{1,3}

Ja: danmark.info, et-eksempel.com etc.

mere korrekt ville nok være:

([-a-z0-9]+\.)*[a-z]{2,4}\.?

{1,3} er ukorrekt da .info jo eksisterer nu, og alle TLD'erne er jo på
mellem 2 og 4 dermed (uden tal).

Men om du nu ikke skulle lave den om til:

([-a-z0-9]+\.)+[a-z]{2,4}

eller:

([-a-z0-9]+\.){2,}[a-z]{2,4}

Er alt efter hvad du skal bruge det til...

--
Mvh. Kim Petersen /| Tlf: +4575831551 |\ Jomfru Ingefreds Vej 18
Software Engineer / | Fax: (none atm.) | \ 7100 Vejle
LSS / | Email: kim@vindinggaard.dk | \ DK - Danmark

Thomas Jensen (06-12-2001)
Kommentar
Fra : Thomas Jensen


Dato : 06-12-01 23:22

Kim Petersen <kim@vindinggaard.dk> wrote in
news:g06svr2t.fsf@mail.vindinggaard.dk:

> {1,3} er ukorrekt da .info jo eksisterer nu, og alle TLD'erne er jo
> på mellem 2 og 4 dermed (uden tal).

science.museum er gyldigt...
(Jeg tror det eneste sikre man kan sige om TLD'er er at de er på mindst
1 bogstav

--
mvh
Thomas Jensen

Kim Petersen (07-12-2001)
Kommentar
Fra : Kim Petersen


Dato : 07-12-01 00:27

Thomas Jensen <thomasNO@SPAM.obscure.dk> writes:

> Kim Petersen <kim@vindinggaard.dk> wrote in
> news:g06svr2t.fsf@mail.vindinggaard.dk:
>
> > {1,3} er ukorrekt da .info jo eksisterer nu, og alle TLD'erne er jo
> > på mellem 2 og 4 dermed (uden tal).
>
> science.museum er gyldigt...
> (Jeg tror det eneste sikre man kan sige om TLD'er er at de er på mindst
> 1 bogstav

..museum slipped my mind... [selv om jeg kan huske min irritation over den ]

Ok, du har ret men museum er den eneste på mere end 4, og der er ingen under
2. Så det smarteste vil nok være at lave den som en special case - og så
ellers følge med på ICANN - selvom de nok ikke accepterer flere i overskuelig
tid.

eller special case for alle med 3 eller over:

(\.([a-z]{2}|com|gov|mil|edu|org|net|int|biz|aero|coop|info|name|pro|museum))

selvom jeg ville foretrække:

(\.([a-z]{2,3}|aero|coop|info|name|museum))

fremfor:

(\.([a-z]{2,4}|museum))

det er jo forholdsvist overskueligt (jeg ved iøvrigt godt at aero og pro endnu
ikke er aktive).

--
Mvh. Kim Petersen /| Tlf: +4575831551 |\ Jomfru Ingefreds Vej 18
Software Engineer / | Fax: (none atm.) | \ 7100 Vejle
LSS / | Email: kim@vindinggaard.dk | \ DK - Danmark

Mickey (07-12-2001)
Kommentar
Fra : Mickey


Dato : 07-12-01 00:45

"Kim Petersen" <kim@vindinggaard.dk> skrev i en meddelelse
news:lmggdj4x.fsf@mail.vindinggaard.dk...


> (\.([a-z]{2,3}|aero|coop|info|name|museum))

den ser rigtig ud, så den prøver jeg med ;)


--
|-|$235-|)k - Mickey - Eko sum lapis
Problemer med forbindelsen ?
- lav en traceroute på http://trace.susie.dk


Thomas Jensen (07-12-2001)
Kommentar
Fra : Thomas Jensen


Dato : 07-12-01 14:35

Kim Petersen <kim@vindinggaard.dk> wrote in
news:lmggdj4x.fsf@mail.vindinggaard.dk:

> .museum slipped my mind... [selv om jeg kan huske min irritation
> over den ]

Hehe, ja den er lidt spøjs.

> Ok, du har ret men museum er den eneste på mere end 4, og der er
> ingen under 2. Så det smarteste vil nok være at lave den som en
> special case - og så ellers følge med på ICANN - selvom de nok ikke
> accepterer flere i overskuelig tid.

Jeg må indrømme, at jeg har svært ved at se formålet med at lave en så
striks validering af TLD'et.
Hvad er der galt med (\.[a-z]+) ? (Eller måske (\.[a-z][a-z0-9]*), er
tal tilladt i TLD'er?).
Efter min mening, er det farligt at have sådanne scripts liggende, som
skal manuelt opdateres når der sker en ekstern ændring.
Hvis man ønsker at validere TLD'et eller hostnavnet, kan man jo altid
spørge en nameserver.

--
mvh
Thomas Jensen

Mogens Meier Christe~ (07-12-2001)
Kommentar
Fra : Mogens Meier Christe~


Dato : 07-12-01 22:12

> Hvad er der galt med (\.[a-z]+) ? (Eller måske (\.[a-z][a-z0-9]*), er
> tal tilladt i TLD'er?).

Ja, tal, bogstaver, bindestreg - er der flere?

Helt enig i dine pointer - der er alt for meget specialisering - hvad nu når
een eller anden ukendt republik kommer på nettet osv.

--
Mvh. Mogens
www.momech.dk




Kim Petersen (08-12-2001)
Kommentar
Fra : Kim Petersen


Dato : 08-12-01 00:39

"Mogens Meier Christensen" <mmc@nospam.dk> writes:

> > Hvad er der galt med (\.[a-z]+) ? (Eller måske (\.[a-z][a-z0-9]*), er
> > tal tilladt i TLD'er?).
>
> Ja, tal, bogstaver, bindestreg - er der flere?
>
> Helt enig i dine pointer - der er alt for meget specialisering - hvad nu når
> een eller anden ukendt republik kommer på nettet osv.

Det er ikke specielt sandsynligt, da TLD'erne svarer til ISO 3166-1-Alpha-2
[såvidt jeg ved] - ellers vil ICANN nok gå videre med alpha-3. [for lande].

Det som er spørgsmålet er hvor mange nye alternative TLD'ere som ICANN har
tænkt sig at skabe.

Ellers er jeg enig - men se det andet svar i tråden.

--
Mvh. Kim Petersen /| Tlf: +4575831551 |\ Jomfru Ingefreds Vej 18
Software Engineer / | Fax: (none atm.) | \ 7100 Vejle
LSS / | Email: kim@vindinggaard.dk | \ DK - Danmark

Kim Petersen (08-12-2001)
Kommentar
Fra : Kim Petersen


Dato : 08-12-01 00:33

Thomas Jensen <thomasNO@SPAM.obscure.dk> writes:

> Kim Petersen <kim@vindinggaard.dk> wrote in
> news:lmggdj4x.fsf@mail.vindinggaard.dk:
>
> > .museum slipped my mind... [selv om jeg kan huske min irritation
> > over den ]
>
> Hehe, ja den er lidt spøjs.
>
> > Ok, du har ret men museum er den eneste på mere end 4, og der er
> > ingen under 2. Så det smarteste vil nok være at lave den som en
> > special case - og så ellers følge med på ICANN - selvom de nok ikke
> > accepterer flere i overskuelig tid.
>
> Jeg må indrømme, at jeg har svært ved at se formålet med at lave en så
> striks validering af TLD'et.
> Hvad er der galt med (\.[a-z]+) ? (Eller måske (\.[a-z][a-z0-9]*), er
> tal tilladt i TLD'er?).
> Efter min mening, er det farligt at have sådanne scripts liggende, som
> skal manuelt opdateres når der sker en ekstern ændring.

Kommer an på hvad du vil bruge det til ellers har du sådan set ret.
Her er et par grunde

1. du vil automagisk finde og konvertere links i klar tekst [og malformed
er dårligt her] - specielt hvis du skal scanne efter valide data eller du
skanner i store datamængder. [Her gælder det specielt hvis du i klartext
ikke har http:// introen].

2. du ønsker ikke at dobbeltchecke med DNS [se nedenunder].

3. sætte fejlmargen på URL indtastning eller indhentning ned.

> Hvis man ønsker at validere TLD'et eller hostnavnet, kan man jo altid
> spørge en nameserver.

Yikes - don't do that! low level gethostbyname() blokerer - DNS er ikke
altid pænt sat op - og du kan risikere *meget* lang ventetid.

NB: en måde at sikre mod ovenstående på er at have en TLD fil, som bliver
autokonverteret til en regex [ville være smart i et administrativt i/f] som
gemmes i en include [så den ikke skal genereres hver gang et script starter].

--
Mvh. Kim Petersen /| Tlf: +4575831551 |\ Jomfru Ingefreds Vej 18
Software Engineer / | Fax: (none atm.) | \ 7100 Vejle
LSS / | Email: kim@vindinggaard.dk | \ DK - Danmark

Thomas Jensen (09-12-2001)
Kommentar
Fra : Thomas Jensen


Dato : 09-12-01 02:00

Kim Petersen <kim@vindinggaard.dk> wrote in
news:r8q6a9mv.fsf@mail.vindinggaard.dk:

> Thomas Jensen <thomasNO@SPAM.obscure.dk> writes:

>> Jeg må indrømme, at jeg har svært ved at se formålet med at lave
>> en så striks validering af TLD'et.
>> Hvad er der galt med (\.[a-z]+) ? (Eller måske
>> (\.[a-z][a-z0-9]*), er tal tilladt i TLD'er?).
>> Efter min mening, er det farligt at have sådanne scripts liggende,
>> som skal manuelt opdateres når der sker en ekstern ændring.
>
> Kommer an på hvad du vil bruge det til ellers har du sådan set ret.
> Her er et par grunde
>
> 1. du vil automagisk finde og konvertere links i klar tekst [og
> malformed er dårligt her] - specielt hvis du skal scanne efter
> valide data eller du skanner i store datamængder. [Her gælder det
> specielt hvis du i klartext ikke har http:// introen].

Mener du f.eks. at undgå at "en linie.Dette er linie to" matcher med
"linie.Dette" ?
Fair nok, men der kunne jo også stå "nu", "de" eller lignende efter
punktum.

> 2. du ønsker ikke at dobbeltchecke med DNS [se nedenunder].

Fair nok, det kan jeg godt forstå at man i mange tilfælde ikke ønsker.

> 3. sætte fejlmargen på URL indtastning eller indhentning ned.

Se herunder.

>> Hvis man ønsker at validere TLD'et eller hostnavnet, kan man jo
>> altid spørge en nameserver.
>
> Yikes - don't do that! low level gethostbyname() blokerer - DNS er
> ikke altid pænt sat op - og du kan risikere *meget* lang ventetid.
>
> NB: en måde at sikre mod ovenstående på er at have en TLD fil, som
> bliver autokonverteret til en regex [ville være smart i et
> administrativt i/f] som gemmes i en include [så den ikke skal
> genereres hver gang et script starter].

Så vidt jeg kan se, ønskes to funktioner udført, identificering af
hostnames, og validering af hostnames.
Det er selvfølgeligt muligt (til en vis grænse) at slå disse to sammen
- spørgsmålet er om det er ønskeligt.
Der er mange forskellige metoder til at validere hostnames, og hvilken
man bruger i en given situation må IMHO være en vurderingssag.

--
Thomas Jensen

Søg
Reklame
Statistik
Spørgsmål : 177552
Tips : 31968
Nyheder : 719565
Indlæg : 6408849
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste