Jeg så at min openoffice 3.2.1 med norsk ordliste godtok
trafikkkontroll og grammatikkkontroll
som ord. Ikke bra.
Grunnen er som hunspell selv sier:
$ echo grammatikkkontroll|hunspell -m -d nb_NO grammatikkkontroll pa:grammatikk st:grammatikk pa:kontroll
med andre ord, hunspell ser på det som "grammatikk"+"kontroll".
# Foreslår derfor å legge til følgende flagg i nb_NO.aff-filen som er i "Norske ordlister"-utvidelsen:
CHECKCOMPOUNDTRIPLE # Flagget gjør at hunspell ikke lenger tillater tre etterfølgende konsonanter, som i "TrafikkKontroll"
og
SIMPLIFIEDTRIPLE # Flagget gjør at hunspell nå godtar "Trafikkontroll" selv om hverken "trafikkontroll" eller "trafik" er i ordlisten. Hunspell regner ut at trafikk+kontroll=trafiKKontroll med bare 2 k)
Har testet det ved å fjerne følgende ord fra .dic-filen og kjøre hunspell over dem, alle ble godkjent selv om de /ikke/ stod i ordlisten. trafikkollaps trafikkonstabel trafikkonsulent trafikkontor trafikkontroll trafikkontrollsystem trafikkontrollør trafikkorps trafikkorridor trafikknute grammatikkontroll
NB Jeg anbefaler *IKKE* å fjerne slike sammensatte ord fra listen, denne forbedringen består kun i at hunspell ikke lenger synes at "trafikkkontroll" er bra, men foreslår heller "trafikkontroll". Se også pussig oppførsel i 2) under.
BUGS/features med hunspell og 1) trafikkork: COMPOUNDMIN = 4 i nb_NO.aff, og det ser ut til at hunspell "stripper" 'kork' for detn første k'en og blir bare til 3 bokstavers 'ork'. Dermed faller trafikk+kork bort. Dette ser jeg på som en bug i hunspell; det ville være bedre å strippe den siste k'en i trafik[k]. Skal se om det kan fikses.
2) grammatikkontroll: Hvis et ord IKKE står i ordlisten (.dic) men kan oppfattes som et sammensatt ord, har hunspell alltid rekkefølge: -dele ordet med mellomrom -sette ordene sammen med bindestrek -SIMPLIFIEDTRIPLE, kkk->kk
For eksempel, siden "grammatikkontroll" ikke står i ordlisten, foreslår hunspell i stedet for grammatikkkontroll: "grammatikk kontroll", "grammatikk-kontroll", "grammatikkontroll" og noen andre forslag.
Skal se om det er mulig å endre prioriteringen. Ville det ikke vært bedre å foreslå "SIMPLIFIEDTRIPLE" som førstevalg, og ord deling eventuelt lenger ned på listen, etter et bindestrek-forslag?
Kjenner jeg folk rett tar de gjerne det forslaget som står øverst, og for øyeblikket er det dessverre "grammatikk kontroll"
Arno PS sett inn [sic] der det passer hehe
[Arno Teigseth]
Jeg så at min openoffice 3.2.1 med norsk ordliste godtok
trafikkkontroll og grammatikkkontroll
som ord. Ikke bra.
Helt klart ikke bra. Har du lyst på tilgang til CVS-arkivet for å kunne fikse dette direkte i kildekoden?
For tilgang må du registrere deg på Alioth som bruker, få noen av oss som er administratorer til å legge deg til prosjektet før du sjekker ut med
CVS_RSH=ssh cvs \ -d :ext:cvs.alioth.debian.org:/cvsroot/spell-norwegian \ co src/spell-norwegian
Endringene dine høres fornuftige ut, men jeg har ikke nok peiling på hunspell til å vite helt hvor det skal inn i kildekoden.
Vennlig hilsen,
On Wed, 2010-10-20 at 08:07 +0200, Petter Reinholdtsen wrote:
Endringene dine høres fornuftige ut, men jeg har ikke nok peiling på hunspell til å vite helt hvor det skal inn i kildekoden.
Jeg er ikke helt i mål jeg heller, men jeg har funnet ihvertfall ett sted som ordner opp litt: https://sourceforge.net/tracker/?func=detail&aid=3091112&group_id=14...
Fungerer bra i min hjemmebygde hunspell; nå finner hunspell ut at trippelkonsonant-ord bare skal være dobbelkonsonant, selv om ordene ikke står i ordlisten :)
Men openoffice har sin egen hunspell-versjon tror jeg (?)
Arno
Den 20. oktober 2010 18:51 skrev Arno Teigseth arnotixe@gmail.com følgende:
Men openoffice har sin egen hunspell-versjon tror jeg (?)
Eg sjekka på PC-en min som kjører Fedora og der bruker OpenOffice.org oppstraumsversjonen.
Trur òg LibreOffice (som alle store distribusjonane vil byte til i framtida) vil rydde opp og få LibreOffice til å bruke oppstraumsversjonen som standard om ikkje OpenOffice gjør det.
Arno
On 21/10/10 08:42, Torstein Adolf Winterseth wrote:
Den 20. oktober 2010 18:51 skrev Arno Teigseth arnotixe@gmail.com følgende:
Men openoffice har sin egen hunspell-versjon tror jeg (?)
Eg sjekka på PC-en min som kjører Fedora og der bruker OpenOffice.org oppstraumsversjonen.
Trur òg LibreOffice (som alle store distribusjonane vil byte til i framtida) vil rydde opp og få LibreOffice til å bruke oppstraumsversjonen som standard om ikkje OpenOffice gjør det.
Arno
Hei.
Hvis dere leverer en funksjonell versjon, så skal jeg fremme denne slik at vi får oppdatert dette her i alt som bruker den samme kildekoden. Når det gjelder distribusjonene så bruker Fedora vanilla OOo (den fra openoffice.org), mens Ubuntu, Mandriva og andre bruker Go-OO.
Olav