Petter Reinholdtsen:
Affix-fila ble laget før 2000, og ingen av dagens deltagere kjenner til hvordan den ble laget. Personlig har jeg ingen planer om å lære meg formatet eller forbedre den. Vet ikke hva andre har planer om.
Takk for informasjonen.
Grunnen er at eg er fryktelig uinteressert i å bruka ein stavekontroll som inneheld ord som nokon folk *synest* burde vera med, men som verken står i Nynorskordboka eller Bokmålsordboka.
Lykke til. Jeg tror du har et urealistisk forhold til hvor komplett ordbanken er, men er interessert i å høre mer om hva du finner ut.
Eg veit utmerka godt kor komplett/ukomplett Ordbanken er. Ordbanken har nøyaktig det Nynorskordboka og Bokmålsordboka har, og det er i utgangspunktet veldig bra. Eventuell støtte for (andre) samansette får komma seinare (og er veldig ønskjelig), då kanskje på eit (halv)automatisert vis.
Sjekk spesielt sammensatte ord, der ordbanken virker å ha kuttet det meste av kjente sammensetninger.
Det hadde berre vore eit poeng viss stavekontrollprosjektet hadde hatt særlig fleire samansettingar, og desse var av høg kvalitet. Slik synest det ikkje i dag. For det første verkar det veldig tilfeldig kva samansette ord som vert lagde til (og ein del «pussige» ord er med), og for det andre er det berre enkeltbøyingar av orda som vert lagde til, òg utan informasjon om kva type ord og bøying som vert brukte, noko som førerer til ein veldig inkonsekvent stavekontroll, og gjer det heller ikkje mogleg å utvikla ein grammatikkontroll eller liknande språkverktøy basert på databasen seinare.
For å ta eit tilfeldig eksempel: Stavenkontrollen (bokmål) inneheld no ordet «meditasjonsteknikker». Men verken grunnordet «meditasjonsteknikk», «meditasjonsteknikken» eller «meditasjonsteknikkene» er med.
Dette er kanskje spesielt uheldig for nynorsk, som jo kan ha mange ulike bøyingar av eitt og same ord. Når einskildbøyingar manglar, mistar eg tiltrua til stavekontrollen. Eg klarar lettare å leva med at det manglar eitt og anna samansett ord (og stavekontrollen kan etter det eg forstå òg settast opp til å godta samansette ord automatisk, sjølv om ein naturlig nok då vil risikera å få godtatt «ulovlige» ord).
Elles verkar det òg heller tilfeldig kva ord som er merkte som bokmålsord, nynorskord og fellesord («meditasjonsteknikk*» er for eksempel ikkje med i nynorskstavekontrollen).
Jeg ville byttet ut norsk.words i dagens stavekontrollpakke med listen over ord du vil ha med, og latt det ferdige byggesystemet ta seg av resten. Da får du støtte for det samme som dagens stavekontrollpakke, og slipper å finne ut av alt som må forstås for å lage et eget opplegg. :) Du trenger kun to "ordklasser" i norsk.words, B og * for henholdsvis bokmål og nynorsk.
OK. Eg får prøva det. So kan eg eventuelt sjå på affiksfila seinare, om det skulle visa seg nyttig.