Karl Ove Hufthammer skrev: (...)
Det hadde berre vore eit poeng viss stavekontrollprosjektet hadde hatt særlig fleire samansettingar, og desse var av høg kvalitet. Slik synest det ikkje i dag. For det første verkar det veldig tilfeldig kva samansette ord som vert lagde til (og ein del «pussige» ord er med), og for det andre er det berre enkeltbøyingar av orda som vert lagde til, òg utan informasjon om kva type ord og bøying som vert brukte, noko som førerer til ein veldig inkonsekvent stavekontroll, og gjer det heller ikkje mogleg å utvikla ein grammatikkontroll eller liknande språkverktøy basert på databasen seinare.
For å ta eit tilfeldig eksempel: Stavenkontrollen (bokmål) inneheld no ordet «meditasjonsteknikker». Men verken grunnordet «meditasjonsteknikk», «meditasjonsteknikken» eller «meditasjonsteknikkene» er med.
Dette er kanskje spesielt uheldig for nynorsk, som jo kan ha mange ulike bøyingar av eitt og same ord. Når einskildbøyingar manglar, mistar eg tiltrua til stavekontrollen. Eg klarar lettare å leva med at det manglar eitt og anna samansett ord (og stavekontrollen kan etter det eg forstå òg settast opp til å godta samansette ord automatisk, sjølv om ein naturlig nok då vil risikera å få godtatt «ulovlige» ord).
Elles verkar det òg heller tilfeldig kva ord som er merkte som bokmålsord, nynorskord og fellesord («meditasjonsteknikk*» er for eksempel ikkje med i nynorskstavekontrollen).
Mye av dette kan vel automatiseres? Vet noe av det ble gjort tidligere ... Selv heller jeg vel heller til at så lenge ordet er korrekt, der det bedre å ta det med. En eventuell grammatikkontroll er vel milevis unna, selv om det sikkert er kjekt å ha?
Jeg ville byttet ut norsk.words i dagens stavekontrollpakke med listen over ord du vil ha med, og latt det ferdige byggesystemet ta seg av resten. Da får du støtte for det samme som dagens stavekontrollpakke, og slipper å finne ut av alt som må forstås for å lage et eget opplegg. :) Du trenger kun to "ordklasser" i norsk.words, B og * for henholdsvis bokmål og nynorsk.
OK. Eg får prøva det. So kan eg eventuelt sjå på affiksfila seinare, om det skulle visa seg nyttig.
Ville vært veldig fint om du orker å dokumentere, eller iallfall nevne, hva du finner ut her på lista.
Som nevnt bør http://no.speling.org/stavekontroll-dokumentasjon.pdf dokumentere alt vi vet, selv om det er mange huller og ting som kan forbedres. For en kort innføring bare i selve byggeprosessen, se: http://no.speling.org/lagNyeOrdlister.html
-Axel