|
| Sammenligning af adresselister Fra : Johnn Nekman |
Dato : 16-10-04 14:04 |
|
Hej gruppe
I forbindelse med at et firma skal udsende store mængder breve, har de
behov for at kunne rydde op i de adresselister de sender til. Adresserne
kommer fra forskellige kilder, og det de ønsker er at kunne fjerne
dobbelte adresser.
Problemet er jo let nok løst, hvis man altid kunne være sikker på at
informationen fra listerne var stavet på samme måde, men det er ikke
sikkert.
Det der ønskes er at adresserne sammenlignes, og ud fra en
sandsynligheds beregning om de er ens, giver brugeren en mulighed for at
checke dem der f.eks. er mere end 80% sammenfald i.
F.eks.
Anders And
Paradisæblevej 111
2210 Andeby
Hr. Anders And
Paradisaeblevej 111, st.
2210 Andeby
Findes der løsninger, som direkte kan lave denne form for sammenligning?
Med venlig hilsen
Johnn Nekman
| |
Jesper Sommer (19-10-2004)
| Kommentar Fra : Jesper Sommer |
Dato : 19-10-04 15:46 |
|
Hej John.
Vi brugte engang en selvstændig konsulent på fyn til at løse en sådan
opgave for en kunde - han programmerede selv noget som virkede ret godt.
Han er vist nok gammel mainframe-haj eller noget.
Ud fra kriterierne vi gav ham (felter der skulle sammenlignes), matchede
han records med forskellig stavemåder, ved at beregne en
procent-sandsynlighed for alle "tæt-på" match. I praksis tyggede han det
vist igennem flere gange for at konsolidere både på navn og på
adresse. Den præcise opskrift er nok hans egen forretningshemmlighed,
men de data vi fik tilbage bestod af to datafiler - een med de vaskede
data, og een med alle dem der måtte opgives og derfor skulle behandles
100% manuelt. Sidstnævnte var under 5% så det var ret godt klaret. Der
var stadig lidt returpost på de vaskede data, men det så ikke ud til at
være fejl i vasken men snarere at vores data bare var et mar måneder gamle.
Skal jeg grave vores gamle papirer igennem og finde et navn og et
telefonnummer ?
Venligst
- Jesper
Johnn Nekman wrote:
> Hej gruppe
>
> I forbindelse med at et firma skal udsende store mængder breve, har de
> behov for at kunne rydde op i de adresselister de sender til. Adresserne
> kommer fra forskellige kilder, og det de ønsker er at kunne fjerne
> dobbelte adresser.
>
> Problemet er jo let nok løst, hvis man altid kunne være sikker på at
> informationen fra listerne var stavet på samme måde, men det er ikke
> sikkert.
>
> Det der ønskes er at adresserne sammenlignes, og ud fra en
> sandsynligheds beregning om de er ens, giver brugeren en mulighed for at
> checke dem der f.eks. er mere end 80% sammenfald i.
>
> F.eks.
>
> Anders And
> Paradisæblevej 111
> 2210 Andeby
>
> Hr. Anders And
> Paradisaeblevej 111, st.
> 2210 Andeby
>
> Findes der løsninger, som direkte kan lave denne form for sammenligning?
>
> Med venlig hilsen
>
> Johnn Nekman
| |
|
|