Petter Reinholdtsen wrote:
[Axel Bojer]
Ikke helt sikker på det fulle omfanget, men da jeg installerte den i OOo viser den f.eks. ikke synonymordgruppene konge og stor, som er ganske store begge to. Både thesaurus-nb.txt og thesaurus-nb-mergnet.txt inneholder disse, men ikke ooo-dist/th_nb_NO_v2/th_nb_NO_v2.idx
Det ser ut til at ordene som er med i en synonymordgruppe finnes i .dat-filen, og ikke i .idx. Både konge og stor er med der.
Jeg lastet ned fila fra synonymer.merg.net for å sammenligne, og fikk følgende:
Resultat av «cat th_nb_NO_v2.idx|wc»: 1453 1589 22500 (no.speling.org) 13013 15243 219358 (synonymer.merg.net) Resultat av «cat th_nb_NO_v2.dat|wc»: 2903 20280 168885 (no.speling.org) 29275 73282 2381672 (synonymer.merg.net)
Merg.net$ ls -lah -rw-r--r-- 1 axel axel 2,3M 2008-03-05 12:01 th_nb_NO_v2.dat -rw-r--r-- 1 axel axel 215K 2008-03-05 12:01 th_nb_NO_v2.idx
no.speling.org: -rw-r--r-- 1 axel axel 165K 2008-03-05 01:21 th_nb_NO_v2.dat -rw-r--r-- 1 axel axel 22K 2008-03-05 01:21 th_nb_NO_v2.idx
Så det ser ut til at det må være ganske mye annet som mangler, både i .dat og .idx :-(
Så på veien mellom de to første filene (som jeg tror er i orden) og det som blir inkludert i stavekontrollfila til OOo i den ferdige zip-fila, så går noe galt. Jeg har en mistanke om at ordene ikke blir lagt inn fra disse filene i det hele tatt, men at den bare bruker de som er i norsk.words, kan det være mulig? Eller den kutter alt annet enn første or i hvert synonymordgruppe og sletter resten (antallet linjer er det samme, så det er utgangspunktet for et slikt gjett).
Med mindre noen finner ut formatet på filene, så er det vanskelig å gjette på hva som kan være galt. En titt i filene fikk meg til å tro at kanskje de fungerer bedre hvis det ikke er mellomrom forran alle ordene. Har oppdatert reglene til å unngå dette. Kan du teste om det ble bedre?
Den kjører nå :-)
Hilsen Axel