|
| crawl Fra : Migger |
Dato : 12-12-06 14:00 |
|
Hej NG
Jeg håber det er den rigtige gruppe eg stiller spørgsmåket i, ellers må i jo
sige til. Så skal jeg nok skamme mig
Jeg har set at de på EDBpriser har lavet en fil der hedder crawl.htm. Jeg
går ud fra at den skal lede søgeroboter i den rigtige retning.
Har nogen erfaringer med dette?
Er det noget der virker?
Er der noget krav til filens navn?
Andet jeg bør vide inden jeg laver sådan en?
Mvh Migger
| |
Jens Gyldenkærne Cla~ (12-12-2006)
| Kommentar Fra : Jens Gyldenkærne Cla~ |
Dato : 12-12-06 15:22 |
|
Migger skrev:
> Jeg håber det er den rigtige gruppe eg stiller spørgsmåket i,
> ellers må i jo sige til. Så skal jeg nok skamme mig
Den er fin nok. Overgruppen - dk.edb.internet.webdesign - havde
måske været et nøk bedre, men der er i praksis meget begrænset
forskel på de to grupper.
> Jeg har set at de på EDBpriser har lavet en fil der hedder
> crawl.htm. Jeg går ud fra at den skal lede søgeroboter i den
> rigtige retning.
Hvor/hvordan har du set det?
< http://edbpriser.dk/crawl.htm> og < http://edbpriser.dk/crawl.html>
melder 404 Not Found.
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html
| |
Holst (12-12-2006)
| Kommentar Fra : Holst |
Dato : 12-12-06 15:27 |
| | |
Migger (12-12-2006)
| Kommentar Fra : Migger |
Dato : 12-12-06 15:54 |
|
> Den er fin nok.
Det er jeg glad for
> Hvor/hvordan har du set det?
Jeg fandt det tilfældigt en dag jeg kiggede deres kildekode igennem.
Crawl filen ligger her: http://edbpriser.dk/include/crawl.htm
| |
Henrik Stidsen (12-12-2006)
| Kommentar Fra : Henrik Stidsen |
Dato : 12-12-06 16:27 |
|
on 12-12-2006, Migger supposed :
> Jeg fandt det tilfældigt en dag jeg kiggede deres kildekode igennem.
> Crawl filen ligger her: http://edbpriser.dk/include/crawl.htm
Det er næppe til gængse søgemaskiner, for det første er det alt for
tydeligt at det ikke er en reel side og for det andet så giver
linkteksten "350" altså ikke noget specielt godt resultat i en
søgemaskine indeksering.
Jeg kunne forestille mig det er til en specifik indeksering, f.eks.
hvis andre sites skal indeksere resultater fra edbpriser.dk.
--
Henrik Stidsen - http://henrikstidsen.dk/
"I read biographies of the greats, and they were so messed up that I
thought I'd better mess myself up. But I couldn't. I'm too small." -
Winona Ryder
| |
per christoffersen (13-12-2006)
| Kommentar Fra : per christoffersen |
Dato : 13-12-06 12:01 |
|
"Henrik Stidsen" <henrikstidsen@gmail.com> skrev i en meddelelse
news:mn.63da7d6ca037779c.34878@news.hs235.dk...
> on 12-12-2006, Migger supposed :
>> Jeg fandt det tilfældigt en dag jeg kiggede deres kildekode igennem.
>> Crawl filen ligger her: http://edbpriser.dk/include/crawl.htm
>
> Det er næppe til gængse søgemaskiner, for det første er det alt for
> tydeligt at det ikke er en reel side og for det andet så giver linkteksten
> "350" altså ikke noget specielt godt resultat i en søgemaskine
> indeksering.
Den er jo nok beregnet på at sende crawlerne videre til de relevante sider,
som så i sig selv må være mere relevante.
Linkteksten er ikke en hyperafgørende parameter for indeksering.
/Per
| |
Jens Gyldenkærne Cla~ (13-12-2006)
| Kommentar Fra : Jens Gyldenkærne Cla~ |
Dato : 13-12-06 13:35 |
|
per christoffersen skrev:
> Teksten på et indgående link til en side har så vidt jeg ved
> ikke betydning for, om den pågældende side indekseres under et
> ord. Det er alene tekst-indholdet på siden selv, der har
> betydning. - Eller tager jeg fejl?
Ja - du tager fejl. Tekstindholdet i indgående links har særdeles
høj betydning for indekseringen af en side - det er bl.a. derfor at
Googlebomber[1] virker.
Noter:
======
[1] < http://en.wikipedia.org/wiki/Google_bomb>
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html
| |
per christoffersen (13-12-2006)
| Kommentar Fra : per christoffersen |
Dato : 13-12-06 13:45 |
|
"Jens Gyldenkærne Clausen" <jens@gyros.invalid> skrev i en meddelelse
news:Xns98988A30A257Cjcdmfdk@gyrosmod.cybercity.dk...
> per christoffersen skrev:
>
>> Teksten på et indgående link til en side har så vidt jeg ved
>> ikke betydning for, om den pågældende side indekseres under et
>> ord. Det er alene tekst-indholdet på siden selv, der har
>> betydning. - Eller tager jeg fejl?
>
> Ja - du tager fejl. Tekstindholdet i indgående links har særdeles
> høj betydning for indekseringen af en side - det er bl.a. derfor at
> Googlebomber[1] virker.
Jeg kan læse, at det har betydning for ranking, men ikke for indeksering...
/Per
| |
Migger (14-12-2006)
| Kommentar Fra : Migger |
Dato : 14-12-06 13:06 |
|
> Ja - du tager fejl. Tekstindholdet i indgående links har særdeles
> høj betydning for indekseringen af en side
Men vil sådan en fil så være en god eller direkte dårlig ting på en side.
Hvis man nu bruger mere sigende linkbeskrivelser?
Eks. http://www.lpcollect.dk/robots_crawl.asp
Det er fordi at jeg har lagt mærke til at google ikke indexerer alle sider i
den database der ligger på www.lpcollect.dk som jeg er webmaster på.
På forsiden ligger et skjult link som linker til:
http://www.lpcollect.dk/results.asp?VisAntal=10&StartFra=1 Det var så min
tanke, at google (og andre) skulle finde det og indexere hele databasen ud
fra linket "næste" på resultatsiden. Den finder også mange sider, men ikke
alle.
Kan det være fordi at linket bare hedder "næste" på alle sider?
| |
Jesper Brunholm (14-12-2006)
| Kommentar Fra : Jesper Brunholm |
Dato : 14-12-06 14:56 |
|
Migger skrev:
> Det er fordi at jeg har lagt mærke til at google ikke indexerer alle sider i
> den database der ligger på www.lpcollect.dk som jeg er webmaster på.
Ting tar tid hvad søgemaskiner angår, men når det er sagt, kan det til
gengæld som regel lade sig gøre med tiden
> På forsiden ligger et skjult link som linker til:
> http://www.lpcollect.dk/results.asp?VisAntal=10&StartFra=1 Det var så min
> tanke, at google (og andre) skulle finde det og indexere hele databasen ud
> fra linket "næste" på resultatsiden. Den finder også mange sider, men ikke
> alle.
Som Henrik S skriver: brug et googlemap i stedet
> Kan det være fordi at linket bare hedder "næste" på alle sider?
Ja. Det er heller ikke videre informativt for menneske-brugere, så støt
da endelig lidt mere op om begge brugertyper ved at lægge mere info i
"næste"-linket
mvh
Jesper Brunholm
| |
Migger (14-12-2006)
| Kommentar Fra : Migger |
Dato : 14-12-06 21:07 |
|
> Ting tar tid hvad søgemaskiner angår, men når det er sagt, kan det til
> gengæld som regel lade sig gøre med tiden
Det ved jeg... Indtil nu har det taget 3 år. :-/
>> Kan det være fordi at linket bare hedder "næste" på alle sider?
> Ja. Det er heller ikke videre informativt for menneske-brugere, så støt da
> endelig lidt mere op om begge brugertyper ved at lægge mere info i
> "næste"-linket
Jeg vil prøve at finde på noget andet så.
Mvh Migger
| |
Jens Gyldenkærne Cla~ (13-12-2006)
| Kommentar Fra : Jens Gyldenkærne Cla~ |
Dato : 13-12-06 13:53 |
|
per christoffersen skrev:
> Jeg kan læse, at det har betydning for ranking, men ikke for
> indeksering...
Læs det med småt ;)
,--------
| He found that a search for "internet rockstar" returned the website
| of a Ben Brown as the first result, even though "internet rockstar"
| did not appear anywhere on Brown's webpage.
`--------
< http://en.wikipedia.org/wiki/Google_bomb#History>
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html
| |
per christoffersen (13-12-2006)
| Kommentar Fra : per christoffersen |
Dato : 13-12-06 14:22 |
|
"Jens Gyldenkærne Clausen" <jens@gyros.invalid> skrev i en meddelelse
news:Xns98988D33831CDjcdmfdk@gyrosmod.cybercity.dk...
> per christoffersen skrev:
>
>> Jeg kan læse, at det har betydning for ranking, men ikke for
>> indeksering...
>
> Læs det med småt ;)
Ok jeg er med nu.
Eksempel:
http://www.internetnews.com/xSP/article.php/3645256
/Per
| |
Henrik Stidsen (13-12-2006)
| Kommentar Fra : Henrik Stidsen |
Dato : 13-12-06 12:04 |
|
per christoffersen wrote:
> Den er jo nok beregnet på at sende crawlerne videre til de relevante sider,
> som så i sig selv må være mere relevante.
> Linkteksten er ikke en hyperafgørende parameter for indeksering.
Næ, men den har alligevel betydning for hvilke ord den pågældende
side findes under så hvis man endelig skal lave den slags oversigter
burde man da bruge lidt mere sigende ord.
| |
per christoffersen (13-12-2006)
| Kommentar Fra : per christoffersen |
Dato : 13-12-06 12:58 |
|
"Henrik Stidsen" <henrikstidsen@gmail.com> skrev i en meddelelse
news:1166007837.570139.196630@j72g2000cwa.googlegroups.com...
>> Den er jo nok beregnet på at sende crawlerne videre til de relevante
>> sider,
>> som så i sig selv må være mere relevante.
>> Linkteksten er ikke en hyperafgørende parameter for indeksering.
> Næ, men den har alligevel betydning for hvilke ord den pågældende
> side findes under så hvis man endelig skal lave den slags oversigter
> burde man da bruge lidt mere sigende ord.
Teksten på et indgående link til en side har så vidt jeg ved ikke betydning
for, om den pågældende side indekseres under et ord. Det er alene
tekst-indholdet på siden selv, der har betydning.
- Eller tager jeg fejl?
/Per
| |
Henrik Stidsen (14-12-2006)
| Kommentar Fra : Henrik Stidsen |
Dato : 14-12-06 14:50 |
|
Migger wrote:
> > Ja - du tager fejl. Tekstindholdet i indgående links har særdeles
> > høj betydning for indekseringen af en side
> Men vil sådan en fil så være en god eller direkte dårlig ting på en side.
> Hvis man nu bruger mere sigende linkbeskrivelser?
Sider der alene indeholder links og som kun er beregnet til robotter er
en skidt ide. Er du uheldig bliver det opfattet som snyd og du bliver
ratet dårligere.
Det er fordi at jeg har lagt mærke til at google ikke indexerer alle
sider i
> den database der ligger på www.lpcollect.dk som jeg er webmaster på.
> På forsiden ligger et skjult link som linker til:
> http://www.lpcollect.dk/results.asp?VisAntal=10&StartFra=1 Det var så min
> tanke, at google (og andre) skulle finde det og indexere hele databasen ud
> fra linket "næste" på resultatsiden. Den finder også mange sider, men ikke
> alle.
Benyt et Google Sitemap istedet, derved kan du fortælle Google hvilke
sider du har, hvor ofte du forventer de bliver opdateret og den slags.
Derudover kan Google lave noget statistik til dig på hvordan dit site
er ratet og den slags. Se på http://www.google.com/webmasters/sitemaps/
| |
Migger (14-12-2006)
| Kommentar Fra : Migger |
Dato : 14-12-06 21:05 |
|
>Sider der alene indeholder links og som kun er beregnet til robotter er
>en skidt ide. Er du uheldig bliver det opfattet som snyd og du bliver
>ratet dårligere.
Det var det jeg var bange for. Det undrer mig bare at EDBpriser har sådan
en.
En søgning på site: www.edbpriser.dk retunerer 130.000 resultater. Så noget
gør de i hvert fald rigtigt.
>Benyt et Google Sitemap istedet, derved kan du fortælle Google hvilke
>sider du har, hvor ofte du forventer de bliver opdateret og den slags.
>Derudover kan Google lave noget statistik til dig på hvordan dit site
>er ratet og den slags. Se på http://www.google.com/webmasters/sitemaps/
Tak, det vil jeg helt sikkert prøve
Mvh Migger
| |
|
|