2008/3/11 Axel Bojer axelb@skolelinux.no:
----- Forwarded message from Geir Lund lundgeir@online.no -----
I selve ordbokfilen "nb_NO.dic" er ordene oppgitt/skrevet med en kode bak seg slik som / og /J og /A og /ABFGH etc.
(...)
Ifølge byggefila og ordlistefila er bokstavene dels koder for hva slags ord det er:
Det er ikkje desse kodane han spør om, men flagga i nb_NO.dic.
Flagga tener først og fremst til å generera andre ordformer, slik at stavekontrollen ikkje berre kjenner att den eine forma som står i ordlista, men òg bøygde former og avleiingar.
Den eine linja «flyttetidspunkt/B» gjer, ved hjelp av affiksregel «B» i nb_NO.aff, at andre former blir godkjende: «flyttetidspunktet, flyttetidspunktets». Sjå etter linjene som byrjar med «SFX B» i nb_NO.aff. (Dette er ein ganske kronglete regel, for han tek høgde for ein del variasjon: «punkt+et», men «rom+m+et», osv. Det finst enklare døme i Hunspell-manualen på http://hunspell.sf.net )
Når eit ord har fleire flagg, er det fleire reglar som gjeld. «flyttetilbud/BG» får «-et» og «-ets» frå B-regelen og fleirtalsforma «flyttetilbudene» frå G-regelen.
Det er eit ope spørsmål kvifor «flyttetidspunkt» manglar fleirtalsformer, og kvifor «flyttetilbud» har genitivsform i eintal, men ikkje i fleirtal. Ordlistene ser ut til å vera *veldig* inkonsekvente slik sett :-(
Ellers kan en oppføring se slik ut: AKPer * 10 B AKPere * 13 B
Altså er begge ordene også gyldieg på nynorsk, statistikktallet står mellom stjerna og bokstaven. Å regne om det tallet får vel heller Petter svare på, det er en helt spesiell utregning som han forklarte en gang :-)
Dersom det er frekvensinformasjon Geir Lund er ute etter, så finst det i råmaterialet norsk.words, ja. Den fila finst her: http://alioth.debian.org/plugins/scmcvs/cvsweb.php/src/spell-norwegian/?cvsr...
Med helsing, Gaute Hvoslef Kvalnes