/ Forside / Teknologi / Udvikling / SQL / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
SQL
#NavnPoint
pmbruun 1704
niller 962
fehaar 730
Interkril.. 701
ellebye 510
pawel 510
rpje 405
pete 350
gibson 320
10  smorch 260
Måske ens.... Sammenlign rækker m. SQL7
Fra : Soren


Dato : 18-03-01 16:33

Hejsa - jeg kan ikke selv regne den her ud - håber på lidt hjælp.

Jeg ønsker at få vist en række over "forventede" dubletter. De er ikke helt
ens, men næsten.

Problem.

Gammel kundeDB og ny kundeDB - jeg vil gerne matche records.
I den ene record kan navnet fx. være
tbl_OLD
ID: 12345
Name: Dansk Bank
Adr: Vestergade 2
Phone: NULL

tbl_NEW
ID: 1000025
Name: Den Danske Bank A/S
Adr: Vestergade 2-6
Phone 86 12 12 12

Hvordan får jeg listet denne som en potentiel identisk række. Det drejer sig
om 60.000 gamle rækker, op mod 500.000 nye, hvor jeg jo helst ikke vil lave
dubletter, hvis de rent faktisk eksisterer under næsten samme benævnelser.

Jeg forestiller mig noget i retning af følgende.






 
 
Soren (18-03-2001)
Kommentar
Fra : Soren


Dato : 18-03-01 16:47

UPS. - det skulle ikke være sendt endnu....

Jeg forestiller mig følgende:

tbl_OLD
ID: 12345
Name: Dansk Bank
Adr: Vestergade 2
Postnr: 8000
Phone: NULL

tbl_NEW
ID: 1000025
Name: Den Danske Bank A/S
Adr: Vestergade 2-6
Postnr: 8000
Phone 86 12 12 12

1. Indlæs navn
2. Check for identisk navn i postnr.
3. Check for identisk adr.
Hvis 2&3 er true - udskriv i én resultat-tabel, med fremmednøgler til de 2
rækker - match: OK

Det er vel meget nemt - men hvad med resten:
?? -Check for størstedelen af name fra tbl_OLD er i name fra tbl_NEW
??-Check for størstedelen af adr fra tbl_OLD er i name - evt. frataget
karakterer bagfra indtil man har fjernet xx% af adressen som
sammenligningsgrundlag.

Fjern mellemrum fra Phone og tjek for ens fx. 6,7 el. 8 første cifre
Skriv i forskellige tabeller afhængigit af resultatet - der kan også være 2
forventede records, hvis der fx. ligger 2 Danske bank på samme Vestergade -
så skal den vel skrive begge rækker.

Er der nogen med erfaring på området?

Tak for hjælpen!

Søren



Lars Kongshøj (19-03-2001)
Kommentar
Fra : Lars Kongshøj


Dato : 19-03-01 01:52

Soren wrote:
> Er der nogen med erfaring på området?

Ja, men den er at du selv bliver nødt til at skræddersy en algoritme til
den slags formål.

--
Lars Kongshøj

Søg
Reklame
Statistik
Spørgsmål : 177554
Tips : 31968
Nyheder : 719565
Indlæg : 6408857
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste