lars nygaard skreiv:
Det stemmer, ja. Hunspell har gode sammensetningshåndteringsmuligheter, men det er en utfordring å bruke disse mulighetene til å lage en sammensetningsmodul med en god balanse mellom presisjon og funnrate (altså som aksepterer alle korrekte sammensetninger, men ikke tror at feilstavede ord er sammensetninger). Jeg har lagt til flagget "/root" for ord som er i grunnform; det er ment som en hjelp for sammensetningsmodulen.
Hunspell tolkar /root som fire flagg: r, o, o og t.
I mine forsøk på å bli kjend med Hunspell har eg sett på korleis bøyingsmønstra kan kodast i .aff-fila, slik at sjølve ordlista (.dic) vert vesentleg kortare. Så langt har eg ikkje gjort noko som ikkje ispell òg klarar, men eg har no fått litt meir innsikt i korleis stavekontrollen er bygd opp.
Eg er usikker på kva nytte stavekontrollen har av bøyingsinformasjon, som Hunspell har rik støtte for. Er det nyttig å vita at «bilen» er eit hankjønnssubstantiv i bunden form eintal, eller er det tilstrekkeleg å vita at det er eit lovleg ord? Samansetjingsanalysen har kanskje nytte av det? «Biltur» og «bilturen» er lov, men ikkje «bilentur».
Veit nokon om litteratur/artiklar som kan vera relevant?
Med helsing, Gaute Hvoslef Kvalnes