Petter Reinholdtsen:
Hm. Kor finn eg denne? Eg lasta ned ei fil som heitte no_NO-pack2-2.0.10.zip og fann ikkje ei slik fil i denne. Er det feil fil eg lasta ned.
Ja, det er feil fil, det er en som er generert ut fra kildekoden, ikke selve kildekoden. Du ønsker nok CVS-koden eller spell-norwegian-2.0.10.tar.gz fra URL:http://alioth.debian.org/frs/?group_id=30577.
OK. Eg har no sett på .myheader-fila, og denne inneheld heller ikkje nokon slik informasjon.
Nedlastingssida på no.speling ord var ikkje so lett å forstå.
Hva gjorde det vanskelig? Forslag til forbedringer?
Det var for eksempel to pakkar (no_NO-pack1-2.0.10.zip) og no_NO- pack2-2.0.10.zip) utan nokon informasjon om kva forskjellen var, eller kven av dei eg skulle velja.
Ja, det stemmer. Det eg reagerte på, var at ho inneheldt «bokstaven» þ, som me vel ikkje brukar på norsk, samt at store og små bokstavar sto hulter til bulter.
Må innrømme at jeg ikke vet hvordan bokstavlisten er satt sammen. Tror den ble kopiert fra en pakke andre har laget.
Det står nemnt i kommentaren over lista korleis ho er laga. Datagrunnlaget inneheld tydeligvis eit ord med ein þ, av éin eller annan grunn.
Kan for øvrig melda at arbeidet med nynorskstavekontrollen min går godt. Eg arbeida litt på han i helga, og har no ein stavekontroll som kjenner att alle orda i Ordbanken, og som ser ut til å gje veldig gode forslag på feilstavingar. For eksempel er rette skrivemåtar av orda i feilstavingslista (som er på bokmål!) for det meste forslag 1, og nesten alltid blant dei 5 øvste.
No gjenstår det hovudsaklig attkjenning av samansette ord, samt mykje testing. Dette krev ein del manuelt arbeid, for å unngå overgenerering, men eg er forsiktig optimistisk på at eg skal få i stand ein ganske brukbar stavekontroll.