/ Forside / Teknologi / Udvikling / SQL / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
SQL
#NavnPoint
pmbruun 1704
niller 962
fehaar 730
Interkril.. 701
ellebye 510
pawel 510
rpje 405
pete 350
gibson 320
10  smorch 260
strukturere ord-liste
Fra : Lars Hoffmann


Dato : 03-02-05 12:40

Hej

Jeg arbejder løs på at lave en korrekturlæser på spansk. Det skal være
til en hjemmeside hvor man skal kunne læse korrektur por en indtastet
tekst.

Jeg har nu fået skaffet mig en liste med ca 50.000 spanske ord, hvilke
skulle dække et rimeligt behov.

Denne liste har jeg så smidt ind i en MySQL 4.1 database. tabellen har 3
felter: ord, lyd, laengde. selve ordet gemmes i "ord", i "lyd" gemmer
jeg det der svarer til soundex(ord), og laengde er naturligvis
length(ord).

Min ide er så at for hvert ord der ikke findes i ordlisten, laver jeg en
søgning a la:

SELECT ord
FROM esp_dict
WHERE lyd = soundex('MITORD')
AND longitud > length('MITORD') - 2
AND longitud < length('MITORD') + 2

for således at finde alle enslydende ord med en længde der tilnærmer sig
det indtastede ord.

Det er jo alt sammen ganske enkelt, men nu kommer det svære: Hvad skal
jeg gøre med alle bøjninger af ordene? Jeg kan jo ikke så godt gemme
alle bøjningerne af ordene i min database, da den jo ville blive helt
enorm, men et eller andet må der jo gøres. Nogen der har en idé til
hvordan jeg kan gemme endelser på en smart måde, således at jeg kan
foretage hurtige søgninger, evt. ved hvilke metoder der bruges i andre
produkter med korrekturlæsere?

Med venlig hilsen
Lars Hoffmann
X-post: dk.edb.programmering, dk.edb.database da jeg ikke kan overskue
hvor den hører hjemme.


--
Posted via Mailgate.ORG Server - http://www.Mailgate.ORG

 
 
Jens Axel Søgaard (03-02-2005)
Kommentar
Fra : Jens Axel Søgaard


Dato : 03-02-05 15:03

Lars Hoffmann wrote:

> Det er jo alt sammen ganske enkelt, men nu kommer det svære: Hvad skal
> jeg gøre med alle bøjninger af ordene?

Prøv at se på databaserne til ispell (eller aspell) og se,
hvordan de behandler bøjninger.

--
Jens Axel Søgaard


Peter Makholm (03-02-2005)
Kommentar
Fra : Peter Makholm


Dato : 03-02-05 20:05

Jens Axel Søgaard <usenet@soegaard.net> writes:

> Prøv at se på databaserne til ispell (eller aspell) og se,
> hvordan de behandler bøjninger.

Hvis man vil lave stavekontrol baseret på lydlighed er det aspell man
skal kikke på. Jeg ved ikke hvor godt soundex virker på spansk, men
aspell kan tilpasses hvordan forskellige sprog lyder.

--
Peter Makholm | Yes, you can fight it, but in the end the ultimate
peter@makholm.net | goal of life is to have fun
http://hacking.dk | -- Linus Torvalds

Lars Hoffmann (04-02-2005)
Kommentar
Fra : Lars Hoffmann


Dato : 04-02-05 09:37

"Peter Makholm" <peter@makholm.net> wrote

> Hvis man vil lave stavekontrol baseret på lydlighed er det aspell man
> skal kikke på. Jeg ved ikke hvor godt soundex virker på spansk, men
> aspell kan tilpasses hvordan forskellige sprog lyder.


Soundex virker ganske glimrende på spansk - faktisk bedre end ved mange
andre sprog, da udtale hænger meget tæt sammen med skriveformen. Dog er
soundex delen ikke mit store problem. At finde alternativer til ord med
fejl er nemt nok. Det sværre for mig er er at finde hvilke ord der er
skreve forkert.
Med venlig hilsen
Lars Hoffmann


--
Posted via Mailgate.ORG Server - http://www.Mailgate.ORG

Jacob Sparre Anderse~ (04-02-2005)
Kommentar
Fra : Jacob Sparre Anderse~


Dato : 04-02-05 17:42

Lars Hoffmann skrev:

> Jeg arbejder løs på at lave en korrekturlæser på spansk. Det skal
> være til en hjemmeside hvor man skal kunne læse korrektur por en
> indtastet tekst.

[...]

Har du overvejet bare at have en Aspell-process liggende som filter i
baggrunden, i stedet for selv at implementere et komplet
stavekontrolprogram?

Jacob
--
"Genes don't matter. It's all physics."

Lars Hoffmann (04-02-2005)
Kommentar
Fra : Lars Hoffmann


Dato : 04-02-05 21:59

Jacob Sparre Andersen wrote:

> Har du overvejet bare at have en Aspell-process liggende som filter i
> baggrunden, i stedet for selv at implementere et komplet
> stavekontrolprogram?

Det vil desværre ikke være muligt da det er en hosted løsning jeg bruger.

Jacob Sparre Anderse~ (07-02-2005)
Kommentar
Fra : Jacob Sparre Anderse~


Dato : 07-02-05 20:17

Lars Hoffmann skrev:
> Jacob Sparre Andersen skrev:

> > Har du overvejet bare at have en Aspell-process liggende som
> > filter i baggrunden, i stedet for selv at implementere et komplet
> > stavekontrolprogram?
>
> Det vil desværre ikke være muligt da det er en hosted løsning jeg
> bruger.

Jeg kan ikke se hvorfor det skulle sætte den slags begrænsninger, men
her er der så en anden mulighed:

http://spellerpages.sourceforge.net/

Jacob
--
»Great minds discuss ideas,
Average minds discuss events,
Small minds discuss people.«

Lars Hoffmann (07-02-2005)
Kommentar
Fra : Lars Hoffmann


Dato : 07-02-05 23:33

Jacob Sparre Andersen wrote:

> Jeg kan ikke se hvorfor det skulle sætte den slags begrænsninger, men
> her er der så en anden mulighed:

Fordi jeg ikke kan bestemme hvilket software der er til rådighed på serveren.
Anyway. Jeg har prøvet at udvide min ordliste til 75.000 ord (mest bøjninger
af eksisterende ord) og det ser ud til at være den rette vej frem.

Med venlig hilsen
Lars Hoffmann

Lars Hoffmann (07-02-2005)
Kommentar
Fra : Lars Hoffmann


Dato : 07-02-05 23:50

Jacob Sparre Andersen wrote:

> http://spellerpages.sourceforge.net/

Den virker forresten pissegodt!

Søg
Reklame
Statistik
Spørgsmål : 177459
Tips : 31964
Nyheder : 719565
Indlæg : 6408195
Brugere : 218881

Månedens bedste
Årets bedste
Sidste års bedste