Petter Reinholdtsen wrote:
[Axel Bojer]
For OOo 1 vil jeg anta at samme oppsett som jeg beskrev, men med denne fila isteden: http://synonymer.merg.net/download/thes_OOo1_nb_NO.zip vil virke, på samme måte som det gjør med OOo 2.0. Har ikke OOo 1.x og kan teste ... Men på den annen side er det vel ikke så mange som fortsatt bruker 1.x ...
Jeg tok en nærmere titt på filene fra synonymer.merg.net, og tror jeg fant årsaken til problemet. Det ser ut til at hvert av ordene i en synonymordgruppe må ha egen oppføring. Jeg har skrevet om thes_to_dat til å gjøre dette. Kan du bygge og teste om det ble bedre? Håper det fungerer, så vi slipper å kopiere de genererte filene fra merg.net. Vil helst at vi har kildekodefilene i versjonskontroll for å forenkle framtidig vedlikehold. Filene i zip-filene er ikke enkle å vedlikeholde.
:-D
Jeg testet igjen, og nå virker både stavekontroll, orddeling og synonymer.
== Småfeil: Fikk en kort feilmelding på kommandolinja, men den ser ikke ut til å være kritisk, da alt virker: warning - incompatible stripping characters and condition: SFX D ar rar [^fmk]er warning - incompatible stripping characters and condition: SFX U �re orde ere warning - incompatible stripping characters and condition: SFX U �re ort ere
En detalj til, er at «norsk bokmål» vises som «Norsk bokm?l» i installasjonsprogrammet for ordboka. Mistenker at det skyldes utf-8 i installasjonsprogrammet og latin1 i ordlistefilene. Vet ikke om det er noen måte å løse det på ...
Skal vi rette småfeilene, eller bare legge det ut på:
http://alioth.debian.org/frs/?group_id=30577
Neste skritt en pressemelding.
Hva bør nevnes:
Forslag: * 623.500 nye ord fra ordbanken er lagt inn * Noen flere forkortelser * Synonymordlister fra synonymer.merg.net
Kanskje noe mer om noen av punktene, f.eks. * At ordbankens ord ble frigitt i fjor og at dette er første versjon der vi drar nytte av dette? * At vi gjerne vil ha frivillige bidrag? (Eller gir det et useriøst inntrykk??)
Fra NEWS:
Release 2.0.10 (2008-03-10)
* Added . after every synonym and put them all into synonymer-nb.txt and not in norsk.words, from where they are removed. --Moved: bm, bnr, cand, dvs, etc, ev, mag, osv, pga --Changed: 'eg * 21 B. to 'eg *' (to only use it in nynorsk) 'mm *' to 'mm * 0 B' (to use it also in bokm<E5>l) --Removed mao and phil --Removed from forkort-nb.txt: Ph.D., S.u., a.a., a.a.C.a., a.m., c.c., cand.occon., cand.rer.polit., f.o., fr.o.m., f<F4>r., f<F4>re., h.o.h., h.t., i.l., k.o., m.a., mu.h., o.dyl., pr.pr., r.p., res.kap., s.st., s.<E5>., sq.in., stud.rer.polit.,v.hj.a., z.B., --Added in forkort-nb.txt: A.C., KrF., Pb., Ph.D., S.s.v., S.u., a.a.C.n., adm., adr., am., bill., bl., bm., cand.hort., cand.oecon., cand.polit. cand.san., cand.scient., cand.sociol, dir., disp., div., dr., dr.art., dr.oecon., dr.scient., dvs., eg., el., etc., ev., fil., fm., forb., forf., fork., forl., forr., forts., fr., gl., gram., hoh., ill., jr., kl., kr., lat., laud., lev., lign., likn., litt., l<F8>., ma., mag., maks., mat., mat.nat., mfl., muh., mus., mva., nat., nr., n<F8>dv., obj., obl., obs., omarb., omg., omtr., on., oppr., org., orig., osv., pga., poet., pol., pr., priv., prod., prof., pron., prot., psyk., pt., q.v., rel., s.<E5>., siviling., sms., sos., sos.dem., sovj., sst., st., stip., stud., stud.san., subj., subst., s<E5>k., s<F8>., tekn., teol., ti., tlf., to., ub., ubest., ug., univ., utg., utt., uttr., v.v., vgs., vha., vs., <E5>rg., <E5>rh., <E5>rl., <E5>v., <F8>.l., <F8>kol., <F8>kon .,
* Add aspell-phonect.dat from Olaf Havnes. Created initial install rules for it. The install rules need to be checked. * Added forms rykker-brevs, rykker-brevene, rykker-brevenes, and marked all forms of this word as K (conservative) (nb) * Added word separator for all words containing Inter-nett. Removed dupliate entry for 'Internett'. Did similar for av-montere, av-montering, frem-over, f<F8>re-setnad, inne-held, inne-halde. * Removed dupliate entry for av-leie, ignorerande, nettverks-tenesta, nettverks-teneste, nettverks-tenestene, nettverks-tenester, rose-maler, skole-medisiner, stor-spiller, tjukkas. * Imported thesarus for bokm<E5>l from synonymer.merg.net. * Add rules to build thesarus for OOo v2. * Updated dictionary server used by the bokmaal script from www.dokpro-test.uio.no to www.dokpro.uio.no. * Added 623500 new words from no.speling.org, most of them imported to no.speling.org from the norwegian project ordbanken.