/ Forside / Karriere / Uddannelse / Højere uddannelser / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Højere uddannelser
#NavnPoint
Nordsted1 1588
erling_l 1224
ans 1150
dova 895
gert_h 800
molokyle 661
berpox 610
creamygirl 610
3773 570
10  jomfruane 570
Sandsynlighedsberegning. Samme stavefejl. ~
Fra : Thomas Hjort


Dato : 15-01-03 16:32

Hejsa.

Hvor sandsynligt er det at der er tale om den samme person som (måske)
udgiver sig for to personer? Kan man beregne en sandsynlighed for om de
skulle være identiske eller kan man argumentere at det er komplet tilfældig?
Det drejer sig om Simon/Gowenna, læs nedenstående analyse:

c betyder citat. Det bruges i de tilfælde, hvor det ser ud som om, at
vedkommende har stavet det således, når man søger på SR. Men når man åbner
søgeresultatet kan man se, at vedkommende ikke har skrevet det og det i
virkeligheden indgår i et citat af en anden bruger.

Rød skrift (og da man ikke kan poste i farve her så er rød det første tal
(det vil sige at det f.eks er 48/X)) angiver antallet af den forkerte
stavemåde
Blå skrift (andet tal (det vil sige at det f.eks er X/0)) angiver antallet
af den rigtige stavemåde
Grøn skrift (her er der kun to tal tilsidst, nemlig 147 og 4*) angiver, hvor
mange, der på SR laver samme fejl. Det er gjort i de tilfælde, hvor det
skulle have været i to ord, fordi man kan ikke på SR søge på to efter ord
hinanden. Eksempelvis "right now" giver alle kommentarer, hvor både "right"
og "now" indgår og det er temmelig mange.

Simon:______________________Gowenna:
wich 48 / 0 ____________________ 42 / 0 (1c)
makeing 3 / 0 (1c)______________ 4 / 0
shareing 6 / 0 __________________ 2 / 0
haveing 4 / 0 ___________________ 2 / 0
useing 12 / 0 (7c)________________ 5 / 0
serval 2 / 0 (1c)_________________ 4 / 0

Har både stavet det rigtigt og forkert:
ammount 11 / 1 _________________ 4 / 2

Skulle have været i to ord:
somone 14 / ? / 147 _________________ 7 / 0
rightnow 23 / ? / 4*) _________________ 26 / 0



 
 
Lasse Reichstein Nie~ (15-01-2003)
Kommentar
Fra : Lasse Reichstein Nie~


Dato : 15-01-03 16:54

"Thomas Hjort" <dsl54291@vip.cybercity.dk> writes:

> Hvor sandsynligt er det at der er tale om den samme person som (måske)
> udgiver sig for to personer? Kan man beregne en sandsynlighed for om de
> skulle være identiske eller kan man argumentere at det er komplet tilfældig?

Det vil nok kræve mere information end bare det du har her.

Hvad med alle andre ord? Er de stavet ens, forskelligt, eller blandet?

Hvad med alle andre skribenter? Hvor mange andre laver samme stavefejl?

Hvis du havde en bunke forskellige skribenter, og en bunke af deres
skriverier, så ville du kunne lave noget statistik på dem, men uden
en fornuftig base kan du ikke sige noget om to specifikke personer.
Det kan jo være at deres fælles fejl er helt almindelige.

/L
--
Lasse Reichstein Nielsen - lrn@hotpop.com
'Faith without judgement merely degrades the spirit divine.'

Henning Makholm (15-01-2003)
Kommentar
Fra : Henning Makholm


Dato : 15-01-03 18:05

Scripsit Lasse Reichstein Nielsen <lrn@hotpop.com>

> Hvis du havde en bunke forskellige skribenter, og en bunke af deres
> skriverier, så ville du kunne lave noget statistik på dem,

Og så alligevel ikke, for hvis man udvalgt de specielle staveformer
man kigger efter, ved at de er fælles for de to skribenter, vil alene
dét give en systematisk bias til fordel for "de er den samme".

Og det vil ikke være let at kvantificere denne bias så længe man ikke
har en formel og ikke-forudindtaget procedure for at udvælge de ord
man kigger på.


Hm, for nylig læste jeg en artikel om at man kunne vurdere stilistiske
forskelle og ligheder ved at bruge et afstandsmål afledt af

f(a,b) = længden af gzip(a)+gzip(b) - længden af gzip(a+b)

Men der skal nok mange data til at vurdere variansen af sådan en
forskel. Desuden kan en systematisk forskel mellem to identiteter
opstå blot ved at de skriver om forskellige emner.

--
Henning Makholm "The practical reason for continuing our
system is the same as the practical reason
for continuing anything: It works satisfactorily."

Søg
Reklame
Statistik
Spørgsmål : 177554
Tips : 31968
Nyheder : 719565
Indlæg : 6408852
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste