Kandu.dk - Sammenligning af adresselister


/ Forside / Teknologi / Udvikling / SQL / Nyhedsindlæg

Glemt dit kodeord?

Brugernavn*

Kodeord *

Husk mig

Brugerservice

Kom godt i gang

Bliv medlem

Seneste indlæg

Find en bruger

Stil et spørgsmål

Skriv et tip

Fortæl en ven

Pointsystemet

Kontakt Kandu.dk

Emnevisning

Kategorier

Alfabetisk

Karriere

Interesser

Teknologi

Reklame

Top 10 brugere

SQL

#	Navn	Point
1	pmbruun	1704
2	niller	962
3	fehaar	730
4	Interkril..	701
5	ellebye	510
6	pawel	510
7	rpje	405
8	pete	350
9	gibson	320
10	smorch	260

Sammenligning af adresselister
Fra : Johnn Nekman

Dato : 16-10-04 14:04

Hej gruppe

I forbindelse med at et firma skal udsende store mængder breve, har de
behov for at kunne rydde op i de adresselister de sender til. Adresserne
kommer fra forskellige kilder, og det de ønsker er at kunne fjerne
dobbelte adresser.

Problemet er jo let nok løst, hvis man altid kunne være sikker på at
informationen fra listerne var stavet på samme måde, men det er ikke
sikkert.

Det der ønskes er at adresserne sammenlignes, og ud fra en
sandsynligheds beregning om de er ens, giver brugeren en mulighed for at
checke dem der f.eks. er mere end 80% sammenfald i.

F.eks.

Anders And
Paradisæblevej 111
2210 Andeby

Hr. Anders And
Paradisaeblevej 111, st.
2210 Andeby

Findes der løsninger, som direkte kan lave denne form for sammenligning?

Med venlig hilsen

Johnn Nekman

Jesper Sommer (19-10-2004)

Kommentar
Fra : Jesper Sommer

Dato : 19-10-04 15:46

Hej John.

Vi brugte engang en selvstændig konsulent på fyn til at løse en sådan
opgave for en kunde - han programmerede selv noget som virkede ret godt.
Han er vist nok gammel mainframe-haj eller noget.

Ud fra kriterierne vi gav ham (felter der skulle sammenlignes), matchede
han records med forskellig stavemåder, ved at beregne en
procent-sandsynlighed for alle "tæt-på" match. I praksis tyggede han det
vist igennem flere gange for at konsolidere både på navn og på
adresse. Den præcise opskrift er nok hans egen forretningshemmlighed,
men de data vi fik tilbage bestod af to datafiler - een med de vaskede
data, og een med alle dem der måtte opgives og derfor skulle behandles
100% manuelt. Sidstnævnte var under 5% så det var ret godt klaret. Der
var stadig lidt returpost på de vaskede data, men det så ikke ud til at
være fejl i vasken men snarere at vores data bare var et mar måneder gamle.

Skal jeg grave vores gamle papirer igennem og finde et navn og et
telefonnummer ?

Venligst

- Jesper

Johnn Nekman wrote:
> Hej gruppe
>
> I forbindelse med at et firma skal udsende store mængder breve, har de
> behov for at kunne rydde op i de adresselister de sender til. Adresserne
> kommer fra forskellige kilder, og det de ønsker er at kunne fjerne
> dobbelte adresser.
>
> Problemet er jo let nok løst, hvis man altid kunne være sikker på at
> informationen fra listerne var stavet på samme måde, men det er ikke
> sikkert.
>
> Det der ønskes er at adresserne sammenlignes, og ud fra en
> sandsynligheds beregning om de er ens, giver brugeren en mulighed for at
> checke dem der f.eks. er mere end 80% sammenfald i.
>
> F.eks.
>
> Anders And
> Paradisæblevej 111
> 2210 Andeby
>
> Hr. Anders And
> Paradisaeblevej 111, st.
> 2210 Andeby
>
> Findes der løsninger, som direkte kan lave denne form for sammenligning?
>
> Med venlig hilsen
>
> Johnn Nekman

Søg

Reklame

Statistik

Spørgsmål :	177794
Tips :	31978
Nyheder :	719565
Indlæg :	6410778
Brugere :	218910

Månedens bedste

Årets bedste

Sidste års bedste