[dfisk]
Er det slik at arbeidet med selve orddatabasen på no.speling.org ligger brakk.
Ja, det døde da den gamle tjeneren falt sammen. Den nye tjeneren er satt opp av Keld og mangler automatikken for korrekturlesning som vi hadde gående. Vi kan høre med ham om han vil sette opp det gamle opplegget, men jeg mistenker det gir mer mening å ha et webbasert system for korrekturlesing i stedet for det gamle epostdrevne. :)
korsvoll@skolelinux.no er i hvert fall ikke å få tak i?
Stemmer nok. Tror uansett det må lages nytt opplegg for korrekturlesing.
Det arbeides mer eller mindre utelukkende med byggingen at datafilene ut fra ordlisten?
Jeg tror ikke det arbeides. :)
Jeg vet dette ikke har mye å gjøre med det jeg spurte om i utgangspunktet, men jeg prøver å få en viss oversikt over prosjektet.
Bra utgangspunkt. :)
Jeg vurderer å prøve å generere .dic- og -.aff-filer ut fra ordlistene fra Norsk ordbank (som etter det jeg kan se, ble oppdatert i april i år). Så vil jeg prøve å få hunspell til å godta sammensatte ord i henhold til regler som forhåpentligvis ikke vil være for kompliserte. (Jeg tenker på morfologisk riktig dannede sammensatte ord uten hensyn til hvor merkelige de måtte være.) Hvordan alt dette gjøres, må jeg først lære, og det blir nok mer omfattende en jeg tror. Men skulle det ikke være en grei plan for å lage en ny, enkel ordliste? Hva er det jeg overser?
Så vidt jeg husker var det noen som sammenlignet den norske stavekontrollen med datafilene fra Norsk ordbank, og oppdaget at svært mange sammensatte ord mangler i ordbanken. Det vil antagelig føre til space-syken for alle som har tiltro til en stavekontroll basert på ordbanken.
Jeg husker ikke detaljene, men erindrer at noen spurte folk i ordbanken hvorfor sammensatte ord ikke var med der, og fikk forklart at på grunn av at det på norsk kan settes sammen hvilke som helst ord, ville det ikke gi mening å ta med sammensatte ord i ordbanken.
Men i en stavekontroll bør en ha med de mest brukte sammensatte ordene, for å unngå at stavekontrollen foreslår særskriving av ord som skal settes sammen.
Uansett antar jeg du oppdager disse og andre egenskaper når du tester litt, så det er bare å sette igang.
Jeg tror vi har importert alle ord fra ordbanken en gang for lenge siden i datasettet som lå på no.speling.org. Det burde antagelig gjøres på nytt, med nytt opplegg for vedlikehold av ordene i stavekontrollen.