Gaute Hvoslef Kvalnes wrote:
On Sat, Apr 12, 2008 at 8:24 PM, Axel Bojer axelb@skolelinux.no wrote:
Hei!
vet vi har snakket om det tidligere, men skal vi ha med egennnavn i ordlista?
Ja, viss ingen eigennamn er med, vil alle få masse «feil» i kvar einaste tekst dei skriv. Eg synest det er opplagt at t.d. norske byar og norske personnamn skal vera med. Spørsmålet er, som du seier, kvar grensa skal gå.
(...)
Ok, da har jeg sendt inn også de. Fant ingen der som krasjer med vanlige feilstavinger, så jeg sendte inn det hele. Til sammen (både egennavn og andre ord) ble det over 600 ord, så dette er en ganske effektiv måte å samle inn ord på. Om andre har dic-filer (Egne Ordlister fra OOo) e.a. liggende, så kom med dem :-)
Jeg har laget et enkelt skript som er ment å forbedres dithen at man som inndata gir en liste med ord, helst også en *.dic-fil fra OOo[1] og som utdata:
WORD: ord STATUS: + COMPOSITE-WORD: ord EDITOR: brukernavn e-post@adresse.no
Jobben blir da bare å gå igjennom ordene som om man hadde fått dem fra orddatabasen og sende dem inn. Jeg legger forøvrig med vilje inn sitattegn foran hver linje, men mulig det ikke er nødvendig.
En videre forbedring ville være å få det rett ut i en e-post, men det vil avhenge av hvilket e-postprogram man bruker, så det lar jeg ligge. Klipp og lim går uansett fort.
Hvis noen har innspill til om det er bedre måter å gjøre dette på, så gi beskjed. Manuell innlegging er jo tungvint. Hvordan gikk det med skriptet noen lagde for å legge inn ord automatisk? Er det funksjonelt for denne typen oppgaver?
Hilsen Axel
NOTER 1: Dic-filene er i binærformat, så jeg er ikke helt sikker på hvordan man søker og erstatter, eller på annet vis henter ut det som står der som ren tekst -- utdrag: ^F^@WBSWG6<FF>^@^@^P^@Naturiakttakelse^L^@Sjelesøkere^L^@
Jeg brukte en tidskrevende halvmanuell metode, så innspill om hvordan dette gjøres uten manuell redigering er velkommen :-)