Jeg så at min openoffice 3.2.1 med norsk ordliste godtok
trafikkkontroll og grammatikkkontroll
som ord. Ikke bra.
Grunnen er som hunspell selv sier:
$ echo grammatikkkontroll|hunspell -m -d nb_NO grammatikkkontroll pa:grammatikk st:grammatikk pa:kontroll
med andre ord, hunspell ser på det som "grammatikk"+"kontroll".
# Foreslår derfor å legge til følgende flagg i nb_NO.aff-filen som er i "Norske ordlister"-utvidelsen:
CHECKCOMPOUNDTRIPLE # Flagget gjør at hunspell ikke lenger tillater tre etterfølgende konsonanter, som i "TrafikkKontroll"
og
SIMPLIFIEDTRIPLE # Flagget gjør at hunspell nå godtar "Trafikkontroll" selv om hverken "trafikkontroll" eller "trafik" er i ordlisten. Hunspell regner ut at trafikk+kontroll=trafiKKontroll med bare 2 k)
Har testet det ved å fjerne følgende ord fra .dic-filen og kjøre hunspell over dem, alle ble godkjent selv om de /ikke/ stod i ordlisten. trafikkollaps trafikkonstabel trafikkonsulent trafikkontor trafikkontroll trafikkontrollsystem trafikkontrollør trafikkorps trafikkorridor trafikknute grammatikkontroll
NB Jeg anbefaler *IKKE* å fjerne slike sammensatte ord fra listen, denne forbedringen består kun i at hunspell ikke lenger synes at "trafikkkontroll" er bra, men foreslår heller "trafikkontroll". Se også pussig oppførsel i 2) under.
BUGS/features med hunspell og 1) trafikkork: COMPOUNDMIN = 4 i nb_NO.aff, og det ser ut til at hunspell "stripper" 'kork' for detn første k'en og blir bare til 3 bokstavers 'ork'. Dermed faller trafikk+kork bort. Dette ser jeg på som en bug i hunspell; det ville være bedre å strippe den siste k'en i trafik[k]. Skal se om det kan fikses.
2) grammatikkontroll: Hvis et ord IKKE står i ordlisten (.dic) men kan oppfattes som et sammensatt ord, har hunspell alltid rekkefølge: -dele ordet med mellomrom -sette ordene sammen med bindestrek -SIMPLIFIEDTRIPLE, kkk->kk
For eksempel, siden "grammatikkontroll" ikke står i ordlisten, foreslår hunspell i stedet for grammatikkkontroll: "grammatikk kontroll", "grammatikk-kontroll", "grammatikkontroll" og noen andre forslag.
Skal se om det er mulig å endre prioriteringen. Ville det ikke vært bedre å foreslå "SIMPLIFIEDTRIPLE" som førstevalg, og ord deling eventuelt lenger ned på listen, etter et bindestrek-forslag?
Kjenner jeg folk rett tar de gjerne det forslaget som står øverst, og for øyeblikket er det dessverre "grammatikk kontroll"
Arno PS sett inn [sic] der det passer hehe