Petter Reinholdtsen wrote:
Et problem vi har hatt med import av ord fra no.speling.org til kildefilene for spell-norwegian (norsk.words) har vært at orddelingsmarkørene ble feilplassert. Årsaken var at den første implementasjonen av importscriptet foretrakk flest mulig ordskillemarkører, noe som ga seg undelige utslag for noen ord med feilinformasjon i no.speling.org.
Jeg har nå skrevet opp importscriptet, til å foredrekke den utgaven med flest og minst stemmer, slik at det skal være minst to personer som er enige om hvor ordskillemarkørene skal være før det tar effekt for stavekontrollen. Det ser ut til å fungere mye bedre enn den første utgaven, og jeg har importert en oppdatert utgave fra no.speling.org til norsk.words.
Er dere enige i at dette er en grei metode?
Jeg så igjennom de ordene som havnet i svn, og kunne ikke se noen feil der i farten, så det ser greit ut.
Flest stemmer er vel greit, det vil si de ordene som flest har rettet på og gitt samme orddeling. Men hva mener du med «minst stemmer»? Om bare en har stemt på en variant, blir ikke det et tynt grunnlag? Og, til sist, har ikke ordbankens lister orddelingsinformasjon som vi kan be om å overkjøre andre varianter?
Hilsen Axel