Videresendt til lista.
Hans
----- Forwarded message from Geir Lund lundgeir@online.no -----
To: hans@nordhaug.priv.no From: Geir Lund lundgeir@online.no Subject: Norsk ordbok Date: Tue, 11 Mar 2008 10:32:33 +0000
Hei.
I selve ordbokfilen "nb_NO.dic" er ordene oppgitt/skrevet med en kode bak seg slik som / og /J og /A og /ABFGH etc.
Slik jeg forstår det betyr koden "hyppigheten" av ordet i forhold til et annet nærliggende ord.
Men hvordan skal jeg oppfatte koden hvis jeg ønsker å benytte ordboken i en annen sammenheng der det brukes et prosenttall (fra 10-100) for disse "hyppighetskodene" dere bruker?
Eller spørsmålet stilt på en annen måte: hvordan skal jeg "forstå" disse kodene?
Eksempel ifra ordboken: flyttetidspunkt/B flyttetilbud/BG flyttetilbøyelighet/A flyttetransport/A flytteutgift/AEG flyttevarsel/B flyttevedtak/B flyttfugl/A flytting/bijnoACEG flyttinga/bijnor flyttingen/bijnoprJ flyttingene/bijnorR
----- End forwarded message -----
Hans F. Nordhaug wrote:
Videresendt til lista.
Hans
----- Forwarded message from Geir Lund lundgeir@online.no -----
To: hans@nordhaug.priv.no From: Geir Lund lundgeir@online.no Subject: Norsk ordbok Date: Tue, 11 Mar 2008 10:32:33 +0000
Hei.
I selve ordbokfilen "nb_NO.dic" er ordene oppgitt/skrevet med en kode bak seg slik som / og /J og /A og /ABFGH etc.
Slik jeg forstår det betyr koden "hyppigheten" av ordet i forhold til et annet nærliggende ord.
Men hvordan skal jeg oppfatte koden hvis jeg ønsker å benytte ordboken i en annen sammenheng der det brukes et prosenttall (fra 10-100) for disse "hyppighetskodene" dere bruker?
Hva skal du bruke hyppighetsinformasjonen til? (nysgjerrig :-)
Eller spørsmålet stilt på en annen måte: hvordan skal jeg "forstå" disse kodene?
Eksempel ifra ordboken: flyttetidspunkt/B flyttetilbud/BG flyttetilbøyelighet/A flyttetransport/A flytteutgift/AEG flyttevarsel/B flyttevedtak/B flyttfugl/A flytting/bijnoACEG flyttinga/bijnor flyttingen/bijnoprJ flyttingene/bijnorR
Ifølge byggefila og ordlistefila er bokstavene dels koder for hva slags ord det er:
# indicator for each `bokm<E5>l' word: # # B Normal words # A `newspaper' words. # N Words from NOU # M Words from mathematics # S Samnorsk, radical forms # K Conservative writing # D Words from Dagbladet # O Words from technical oil business # C Sammendragning, like `idag'.
Stjerne etter ordet betyr at det er nynorsk.
Ellers kan en oppføring se slik ut: AKPer * 10 B AKPere * 13 B
Altså er begge ordene også gyldieg på nynorsk, statistikktallet står mellom stjerna og bokstaven. Å regne om det tallet får vel heller Petter svare på, det er en helt spesiell utregning som han forklarte en gang :-)
Hilsen Axel
Axel Bojer:
# C Sammendragning, like `idag'.
Håpar dette ikkje er eit reelt eksempel, då «idag» *ikkje* er korrekt stavemåte på norsk!
Karl Ove Hufthammer wrote:
Axel Bojer:
# C Sammendragning, like `idag'.
Håpar dette ikkje er eit reelt eksempel, då «idag» *ikkje* er korrekt stavemåte på norsk!
grep -i finner:
idag * 29 B
Så, da er det nok en feil, vi får få rettet den til neste utgave.
Regner med beste metode er e-postsystemet på thyge, når bare det er på beina igjen ...
Hilsen Axel
On Tue, 2008-03-11 at 14:39 +0100, Axel Bojer wrote:
Karl Ove Hufthammer wrote:
Axel Bojer:
# C Sammendragning, like `idag'.
Håpar dette ikkje er eit reelt eksempel, då «idag» *ikkje* er korrekt stavemåte på norsk!
grep -i finner:
idag * 29 B
Så, da er det nok en feil, vi får få rettet den til neste utgave.
ja, rett kategori er "A `newspaper' words" eller "K Conservative writing". "idag" er lovleg riksmål, og vert brukt i t.d. Aftenposten.
Axel Bojer skrev:
Regner med beste metode er e-postsystemet på thyge, når bare det er på beina igjen ...
Det er det. (Selvom det tog lidt tid.)
God fornøjelse,
Jacob
[Jacob Sparre Andersen]
Regner med beste metode er e-postsystemet på thyge, når bare det er på beina igjen ...
Det er det. (Selvom det tog lidt tid.)
God fornøjelse,
Jeg hadde ventet a motta korrekturlesingsepost i dag morges, hvis det er på beina igjen. Det gjorde jeg ikke. Det er altså fortsatt ikke operativt. Kan du ta en titt på hva som er galt?
Vennlig hilsen,
Petter Reinholdtsen skrev:
Jeg hadde ventet a motta korrekturlesingsepost i dag morges, hvis det er på beina igjen. Det gjorde jeg ikke. Det er altså fortsatt ikke operativt. Kan du ta en titt på hva som er galt?
Det var brugerne »spelingnb« og »spelingnn« der ikke havde fået genaktiveret deres crontab efter opgraderingen af systemet. Det er ordnet nu.
Jacob
[Jacob Sparre Andersen]
Det var brugerne »spelingnb« og »spelingnn« der ikke havde fået genaktiveret deres crontab efter opgraderingen af systemet. Det er ordnet nu.
Aha. Det hjalp. I dag fikk jeg korrekturlesingsepost. Forsøk på å sende inn korrektur feiled, dog:
A message that you sent could not be delivered to one or more of its recipients. This is a permanent error. The following address(es) failed:
korrektur@nb.speling.org SMTP error from remote mail server after RCPT TO:korrektur@nb.speling.org: host nb.speling.org [130.225.226.90]: 550 5.1.1 korrektur@nb.speling.org: Recipient address rejected: User unknown in virtual alias table
Mer som mangler? Kanskje oppskriften som beskriver hvordan systemet settes opp trenger noen flere punkter?
Vennlig hilsen,
Petter Reinholdtsen skrev:
Aha. Det hjalp. I dag fikk jeg korrekturlesingsepost. Forsøk på å sende inn korrektur feiled, dog:
A message that you sent could not be delivered to one or more of its recipients. This is a permanent error. The following address(es) failed:
korrektur@nb.speling.org
Den modtageradresse var ikke sat op for »spelingnb«-brugeren. Nu er både korrektur@nb.speling.org og korrektur@nn.speling.org gyldige modtageradresser for korrekturbeskeder. Skal jeg udvide med andre adresser? Nu jeg er i gang.
Mer som mangler? Kanskje oppskriften som beskriver hvordan systemet settes opp trenger noen flere punkter?
Da jeg satte tingene op, oprettede jeg bare adresserne »corrections« og »maintainer« på hvert af »??.speling.org«-domænerne. Det var ikke helt nok.
Jacob
*Jacob Sparre Andersen:
Petter Reinholdtsen skrev:
Jeg hadde ventet a motta korrekturlesingsepost i dag morges, hvis det er på beina igjen. Det gjorde jeg ikke. Det er altså fortsatt ikke operativt. Kan du ta en titt på hva som er galt?
Det var brugerne »spelingnb« og »spelingnn« der ikke havde fået genaktiveret deres crontab efter opgraderingen af systemet. Det er ordnet nu.
Tja, jeg har stadig problemer. Mailene MIME-deklareres med «Content-Type: text/plain; charset=unknown-8bit».
Min klient vet dessverre ikke hva unknown-8bit er, og følgelig blir det feil hvis noen ord skulle inneholde æ, ø eller å.
Robert Bauck Hamar skrev:
Tja, jeg har stadig problemer. Mailene MIME-deklareres med «Content-Type: text/plain; charset=unknown-8bit».
Tak for fejlmeddelelsen. Problemet var at de »localer« der bliver brugt på »spelingnb«- og »spelingnn«-kontierne ikke var sat op på maskinen.
Jeg håber at vi er ved at have luget ud i problemerne nu.
God fornøjelse,
Jacob
PS: Jeg har sat et par af mine studerende til at arbejde på et PHP-program, der kan bruges til webbaseret korrekturlæsning af ordlisterne.
[Jacob Sparre Andersen]
Tak for fejlmeddelelsen. Problemet var at de »localer« der bliver brugt på »spelingnb«- og »spelingnn«-kontierne ikke var sat op på maskinen.
Ah, utmerket. Nå får i hvert fall jeg epost med charset=iso-8859-1. :)
Jeg håber at vi er ved at have luget ud i problemerne nu.
Jeg også. :)
God fornøjelse,
Jacob
PS: Jeg har sat et par af mine studerende til at arbejde på et PHP-program, der kan bruges til webbaseret korrekturlæsning af ordlisterne.
Det høres bra ut. Vil det ha en SQL-base i bunnen? Kanskje sqlite er en god ide?
Vennlig hilsen,
Petter Reinholdtsen skrev:
[Jacob Sparre Andersen]
PS: Jeg har sat et par af mine studerende til at arbejde på et PHP-program, der kan bruges til webbaseret korrekturlæsning af ordlisterne.
Det høres bra ut. Vil det ha en SQL-base i bunnen? Kanskje sqlite er en god ide?
Det vil bare køre direkte ovenpå det eksisterende speling.org-system.
Jacob
Petter Reinholdtsen wrote:
[Jacob Sparre Andersen]
Tak for fejlmeddelelsen. Problemet var at de »localer« der bliver brugt på »spelingnb«- og »spelingnn«-kontierne ikke var sat op på maskinen.
Ah, utmerket. Nå får i hvert fall jeg epost med charset=iso-8859-1. :)
Jeg håber at vi er ved at have luget ud i problemerne nu.
Jeg også. :)
God fornøjelse,
Noen dager nå så har utsendingene stoppet opp. Kan du, jacob, sjekke hva som er galt?
Hilsen Axel Bojer
Axel Bojer skrev:
Noen dager nå så har utsendingene stoppet opp. Kan du, jacob, sjekke hva som er galt?
Det er tilsyneladende et generelt problem med at få post ud fra maskinen. :-(
Jeg ser på det.
Jacob
Jacob Sparre Andersen skrev:
Axel Bojer skrev:
Noen dager nå så har utsendingene stoppet opp. Kan du, jacob, sjekke hva som er galt?
Det er tilsyneladende et generelt problem med at få post ud fra maskinen. :-(
Jeg ser på det.
Så kører det igen.
God fornøjelse,
Jacob
[Karl Ove Hufthammer]
Håpar dette ikkje er eit reelt eksempel, då «idag» *ikkje* er korrekt stavemåte på norsk!
Den er et reelt eksempel. Den er så vidt jeg kan se importert fra ordbanken. Følgende finnes i fullform_bm.txt:
84383 idag idag adv 695 0
Vennlig hilsen,
2008/3/11 Axel Bojer axelb@skolelinux.no:
----- Forwarded message from Geir Lund lundgeir@online.no -----
I selve ordbokfilen "nb_NO.dic" er ordene oppgitt/skrevet med en kode bak seg slik som / og /J og /A og /ABFGH etc.
(...)
Ifølge byggefila og ordlistefila er bokstavene dels koder for hva slags ord det er:
Det er ikkje desse kodane han spør om, men flagga i nb_NO.dic.
Flagga tener først og fremst til å generera andre ordformer, slik at stavekontrollen ikkje berre kjenner att den eine forma som står i ordlista, men òg bøygde former og avleiingar.
Den eine linja «flyttetidspunkt/B» gjer, ved hjelp av affiksregel «B» i nb_NO.aff, at andre former blir godkjende: «flyttetidspunktet, flyttetidspunktets». Sjå etter linjene som byrjar med «SFX B» i nb_NO.aff. (Dette er ein ganske kronglete regel, for han tek høgde for ein del variasjon: «punkt+et», men «rom+m+et», osv. Det finst enklare døme i Hunspell-manualen på http://hunspell.sf.net )
Når eit ord har fleire flagg, er det fleire reglar som gjeld. «flyttetilbud/BG» får «-et» og «-ets» frå B-regelen og fleirtalsforma «flyttetilbudene» frå G-regelen.
Det er eit ope spørsmål kvifor «flyttetidspunkt» manglar fleirtalsformer, og kvifor «flyttetilbud» har genitivsform i eintal, men ikkje i fleirtal. Ordlistene ser ut til å vera *veldig* inkonsekvente slik sett :-(
Ellers kan en oppføring se slik ut: AKPer * 10 B AKPere * 13 B
Altså er begge ordene også gyldieg på nynorsk, statistikktallet står mellom stjerna og bokstaven. Å regne om det tallet får vel heller Petter svare på, det er en helt spesiell utregning som han forklarte en gang :-)
Dersom det er frekvensinformasjon Geir Lund er ute etter, så finst det i råmaterialet norsk.words, ja. Den fila finst her: http://alioth.debian.org/plugins/scmcvs/cvsweb.php/src/spell-norwegian/?cvsr...
Med helsing, Gaute Hvoslef Kvalnes