Et problem vi har hatt med import av ord fra no.speling.org til kildefilene for spell-norwegian (norsk.words) har vært at orddelingsmarkørene ble feilplassert. Årsaken var at den første implementasjonen av importscriptet foretrakk flest mulig ordskillemarkører, noe som ga seg undelige utslag for noen ord med feilinformasjon i no.speling.org.
Jeg har nå skrevet opp importscriptet, til å foredrekke den utgaven med flest og minst stemmer, slik at det skal være minst to personer som er enige om hvor ordskillemarkørene skal være før det tar effekt for stavekontrollen. Det ser ut til å fungere mye bedre enn den første utgaven, og jeg har importert en oppdatert utgave fra no.speling.org til norsk.words.
Er dere enige i at dette er en grei metode?
Vennlig hilsen,
Petter Reinholdtsen wrote:
Et problem vi har hatt med import av ord fra no.speling.org til kildefilene for spell-norwegian (norsk.words) har vært at orddelingsmarkørene ble feilplassert. Årsaken var at den første implementasjonen av importscriptet foretrakk flest mulig ordskillemarkører, noe som ga seg undelige utslag for noen ord med feilinformasjon i no.speling.org.
Jeg har nå skrevet opp importscriptet, til å foredrekke den utgaven med flest og minst stemmer, slik at det skal være minst to personer som er enige om hvor ordskillemarkørene skal være før det tar effekt for stavekontrollen. Det ser ut til å fungere mye bedre enn den første utgaven, og jeg har importert en oppdatert utgave fra no.speling.org til norsk.words.
Er dere enige i at dette er en grei metode?
Jeg så igjennom de ordene som havnet i svn, og kunne ikke se noen feil der i farten, så det ser greit ut.
Flest stemmer er vel greit, det vil si de ordene som flest har rettet på og gitt samme orddeling. Men hva mener du med «minst stemmer»? Om bare en har stemt på en variant, blir ikke det et tynt grunnlag? Og, til sist, har ikke ordbankens lister orddelingsinformasjon som vi kan be om å overkjøre andre varianter?
Hilsen Axel
[Axel Bojer]
Jeg så igjennom de ordene som havnet i svn, og kunne ikke se noen feil der i farten, så det ser greit ut.
Flest stemmer er vel greit, det vil si de ordene som flest har rettet på og gitt samme orddeling.
Bra.
Men hva mener du med «minst stemmer»?
Jeg mener at hver korrekturleser har en stemme pr. ord, og systemet vil velge orddelingsmønsteret som er sendt inn av flest korrekturlesere, så sant det er mer enn en korrekturleser som har valgt det orddelingsmønsteret.
Om bare en har stemt på en variant, blir ikke det et tynt grunnlag?
Nettopp. Derfor må det være mer enn en.
Og, til sist, har ikke ordbankens lister orddelingsinformasjon som vi kan be om å overkjøre andre varianter?
Har du sett noe slikt? Har ikke sett tegn til det selv.
Vennlig hilsen,