Hans F. Nordhaug wrote:
Videresendt til lista.
Hans
----- Forwarded message from Geir Lund lundgeir@online.no -----
To: hans@nordhaug.priv.no From: Geir Lund lundgeir@online.no Subject: Norsk ordbok Date: Tue, 11 Mar 2008 10:32:33 +0000
Hei.
I selve ordbokfilen "nb_NO.dic" er ordene oppgitt/skrevet med en kode bak seg slik som / og /J og /A og /ABFGH etc.
Slik jeg forstår det betyr koden "hyppigheten" av ordet i forhold til et annet nærliggende ord.
Men hvordan skal jeg oppfatte koden hvis jeg ønsker å benytte ordboken i en annen sammenheng der det brukes et prosenttall (fra 10-100) for disse "hyppighetskodene" dere bruker?
Hva skal du bruke hyppighetsinformasjonen til? (nysgjerrig :-)
Eller spørsmålet stilt på en annen måte: hvordan skal jeg "forstå" disse kodene?
Eksempel ifra ordboken: flyttetidspunkt/B flyttetilbud/BG flyttetilbøyelighet/A flyttetransport/A flytteutgift/AEG flyttevarsel/B flyttevedtak/B flyttfugl/A flytting/bijnoACEG flyttinga/bijnor flyttingen/bijnoprJ flyttingene/bijnorR
Ifølge byggefila og ordlistefila er bokstavene dels koder for hva slags ord det er:
# indicator for each `bokm<E5>l' word: # # B Normal words # A `newspaper' words. # N Words from NOU # M Words from mathematics # S Samnorsk, radical forms # K Conservative writing # D Words from Dagbladet # O Words from technical oil business # C Sammendragning, like `idag'.
Stjerne etter ordet betyr at det er nynorsk.
Ellers kan en oppføring se slik ut: AKPer * 10 B AKPere * 13 B
Altså er begge ordene også gyldieg på nynorsk, statistikktallet står mellom stjerna og bokstaven. Å regne om det tallet får vel heller Petter svare på, det er en helt spesiell utregning som han forklarte en gang :-)
Hilsen Axel