____________________________________________________________________ / \ _ _ _ | | | |_ _____ _ __ __| | __ _ _ __ | |_| \ \ / / _ | '__/ _` |/ _` | '_ \ | _ |\ V / (_) | | | (_| | (_| | | | | |_| |_| _/ ___/|_| __,_|__,_|_| |_|
_ _ _ _ _ _ _ _ _ _ ___ _ __ __| | (_)___| |_ ___ _ __ ___ | |__ | (_)_ __ | |_(_) | / _ | '__/ _` | | / __| __/ _ \ '_ \ / _ \ | '_ | | | '__| | __| | | | (_) | | | (_| | | __ \ || __/ | | | __/ | |_) | | | | | |_| | | ___/|_| __,_|_|_|___/_____|_| |_|___| |_.__/|_|_|_| __|_|_|
========================================================================
Terje Reite og jeg har arbeidet med dokumentasjon og forsøkt å få en oversikt over prosjektet på stavekontrollmøtet i dag. Et av resultatene var en oversikt over den veien ordene går fra noen melder dem inn til en ordliste kommer ut. Det er viktig å ha full oversikt over hva som skjer, hvorfor og hvordan på hvert trinn for å kunne videreutvikle prosjektet og gjøre det mulig for nye bidragsytere å delta.
Derfor en slags flytdiagram for å vise et ords livsløp fra menneskemunn til ordliste :-)
/| |
Innmelding av ord. Metoder: E-post, ord fra ordbanken og fra Rune Klevelands ordliste, innmeldinger vha. skript
| | | | -> Overføring vha. | |/ > Petters skript \ / > (navn? plassering?) V
_ _| |_
Databasen på www.speling.org (dette er vel egentlig en ren tekst fil og ikke en ekte database, stemmer det?) -> Har en del feil og mangler, kanskje noen av dem kan rettes på om man leser dokumentasjonen. Eks.: Hvordan fjerne ord? Hva gjør vi med dobbeltoppføringer?
| | | | -> Overføring vha. | |/ > Petters skript \ / > «speling2words» V
_ _| _|
Fila «norsk.words» på no.speling.org -- Hovedkilden for alle de ordlistene
| | | | -> Overføring vha. | |/ > Rune Klevelands skript \ / > «Makefile» V
|_| |
Ferdige ordlistefiler for ispell/aspell/myspell/hunspell som kan offentliggjøres og tas i bruk av f.eks. OOo, Thunderbird, Firefox, Koffice o.a.
_________ Hilsen Axel _________________________________________/
Axel Bojer skrev:
Databasen på www.speling.org (dette er vel egentlig en ren tekst fil og ikke en ekte database, stemmer det?)
Det er ganske rigtigt et antal tekstfiler.
Eks.: Hvordan fjerne ord?
Den letteste måde er at stemme dem ud af listen. Hvis vi for eksempel ikke mener at »dildsnaps« hører til i den nynorske ordliste, kan vi sende beskeden
WORD: dildsnaps STATUS: - EDITOR: mig
til korrektur@nn.speling.org. Dem redaktionen har givet lov til det, kan også bruge »AUTHORITY«-feltet til at understrege vigtigheden af at ordet bliver strøget fra listen.
Jacob
[Jacob Sparre Andersen]
til korrektur@nn.speling.org. Dem redaktionen har givet lov til det, kan også bruge »AUTHORITY«-feltet til at understrege vigtigheden af at ordet bliver strøget fra listen.
Hvordan kan vi stemme ut ord som er registrert med AUTHORITY-feltet? Jeg la inn alle ordene fra ordbanken med AUTHORITY-feltet satt, og det fikk uventet effekt der alle ordene øyeblikkelig ble ansett som godkjent av 4 stykker, og de ble umulig å steme ut på vanlig vis.
Ellers, Axel, til flytskjemaet ditt. Det er ganske korrekt, men jeg kan ikke ta ansvaret for å ha skrevet alle scriptene. Noe av det kommer fra speling.org-prosjektet, der Jacob er sentral.
Vennlig hilsen,
Petter Reinholdtsen skrev:
Hvordan kan vi stemme ut ord som er registrert med AUTHORITY-feltet?
Ved at lade som om du selv er en lige så stor autoritet.
(Eller ved at gå ind og slette de relevante »AUTHORITY«-felter manuelt i de relevante filer.)
Jacob
Jacob Sparre Andersen wrote:
Petter Reinholdtsen skrev:
Hvordan kan vi stemme ut ord som er registrert med AUTHORITY-feltet?
Ved at lade som om du selv er en lige så stor autoritet.
(Eller ved at gå ind og slette de relevante »AUTHORITY«-felter manuelt i de relevante filer.)
apropos det: Kan man altså redigere fila manuelt? Eller er det slik at endringer man gjør for hånd vil bli overskrevet igjen automatisk fra et eller annet hold?
Når det gjelder kilden, den jeg fant foreløpig (for norsk) er: http://tyge.sslug.dk/~korsvoll/nb.speling.org/htdocs/status/
eller er denne en kopi av en original et annet sted?
Hilsen Axel
On 11/6/07, Axel Bojer axelb@skolelinux.no wrote:
Jacob Sparre Andersen wrote:
Petter Reinholdtsen skrev:
Hvordan kan vi stemme ut ord som er registrert med AUTHORITY-feltet?
Ved at lade som om du selv er en lige så stor autoritet.
(Eller ved at gå ind og slette de relevante »AUTHORITY«-felter manuelt i de relevante filer.)
apropos det: Kan man altså redigere fila manuelt? Eller er det slik at endringer man gjør for hånd vil bli overskrevet igjen automatisk fra et eller annet hold?
Når det gjelder kilden, den jeg fant foreløpig (for norsk) er: http://tyge.sslug.dk/~korsvoll/nb.speling.org/htdocs/status/
eller er denne en kopi av en original et annet sted?
Ja, kjelda ligg på eit eige område på tyge. For å redigere kjelda manuelt må ein logge inn på tyge med ssh.
Jacob, kan du gje Axel konto på tyge?
Håvard
Håvard Korsvoll skrev:
Jacob, kan du gje Axel konto på tyge?
Ja. Det er bare den sædvanlige besked (navn, ssh-nøgle, telefonnummer og projekt) til admin@tyge.sslug.dk. Så skal jeg nok tage mig af det praktiske (hvis der ikke er en anden der kommer mig i forkøbet).
God fornøjelse,
Jacob
Axel Bojer skrev:
Kan man altså redigere fila manuelt?
Ja.
Eller er det slik at endringer man gjør for hånd vil bli overskrevet igjen automatisk fra et eller annet hold?
Ikke hvis man sørger for at ændre tingene _alle_ de steder de skal ændres.
Når det gjelder kilden, den jeg fant foreløpig (for norsk) er: http://tyge.sslug.dk/~korsvoll/nb.speling.org/htdocs/status/
eller er denne en kopi av en original et annet sted?
Det er temmelig sikkert en kopi af filen »/var/speling.org/nb/complete.ds« (på Tyge), der igen genereres udfra alle filerne i kataloget »/var/speling.org/nb/data/« (og muligvis også den eksisterende udgave af »/var/speling.org/nb/complete.ds«).
God fornøjelse,
Jacob
Jacob Sparre Andersen wrote:
Axel Bojer skrev:
Kan man altså redigere fila manuelt?
Ja.
Ok, nyttig å vite :-)
Eller er det slik at endringer man gjør for hånd vil bli overskrevet igjen automatisk fra et eller annet hold?
Ikke hvis man sørger for at ændre tingene _alle_ de steder de skal ændres.
... og hvilke steder er det? De to du nevner nedenfor?
Når det gjelder kilden, den jeg fant foreløpig (for norsk) er: http://tyge.sslug.dk/~korsvoll/nb.speling.org/htdocs/status/
eller er denne en kopi av en original et annet sted?
Det er temmelig sikkert en kopi af filen »/var/speling.org/nb/complete.ds« (på Tyge), der igen genereres udfra alle filerne i kataloget »/var/speling.org/nb/data/« (og muligvis også den eksisterende udgave af »/var/speling.org/nb/complete.ds«).
Hvilken av disse er den det kommer an på (originalen)?
Hilsen Axel
Axel Bojer skrev:
Jacob Sparre Andersen wrote:
Ikke hvis man sørger for at ændre tingene _alle_ de steder de skal ændres.
... og hvilke steder er det? De to du nevner nedenfor?
Det mener jeg. Men det vil kræve en gennemgang af dokumentationen (læs: kildeteksten) at finde ud af det med sikkerhed.
Det er temmelig sikkert en kopi af filen »/var/speling.org/nb/complete.ds« (på Tyge), der igen genereres udfra alle filerne i kataloget »/var/speling.org/nb/data/« (og muligvis også den eksisterende udgave af »/var/speling.org/nb/complete.ds«).
Hvilken av disse er den det kommer an på (originalen)?
Når »update_dictionary« kører, læser den ».../collected.ds« og alle filerne i ».../incoming.ds/«. Filerne i ».../data/« er bare en sikkerhedskopi af de indkomne data.
Det burde altså være nok at rette i ».../collected.ds«.
God fornøjelse,
Jacob
Jacob Sparre Andersen wrote:
Axel Bojer skrev:
Jacob Sparre Andersen wrote:
Ikke hvis man sørger for at ændre tingene _alle_ de steder de skal ændres.
... og hvilke steder er det? De to du nevner nedenfor?
Det mener jeg. Men det vil kræve en gennemgang af dokumentationen (læs: kildeteksten) at finde ud af det med sikkerhed.
Det er temmelig sikkert en kopi af filen »/var/speling.org/nb/complete.ds« (på Tyge), der igen genereres udfra alle filerne i kataloget »/var/speling.org/nb/data/« (og muligvis også den eksisterende udgave af »/var/speling.org/nb/complete.ds«).
Hvilken av disse er den det kommer an på (originalen)?
Når »update_dictionary« kører, læser den ».../collected.ds« og alle filerne i ».../incoming.ds/«. Filerne i ».../data/« er bare en sikkerhedskopi af de indkomne data.
Det burde altså være nok at rette i ».../collected.ds«.
Flott! Da har vi en nødutgang for å rette brysomme feil :-)
God fornøjelse,
:-)
Hilsen Axel
Axel Bojer:
Innmelding av ord. Metoder: E-post, ord fra ordbanken og fra Rune Klevelands ordliste, innmeldinger vha. skript
Eg håpar dette er ein prosess som blir kjørt kvar gong stavekontrollen vert laga, i staden for at det er ein éingongsgreie. For eksempel inneheldt ordlistene frå ordbanken fleire kodingsfeil for enkelt særnamn som visstnok skal vera retta no. Nye/fiksa/fjerna ord frå ordbanken bør automatisk leggast til / fiksast / fjernast i stavekontrollen når førstnemnte vert oppdatert.
[Karl Ove Hufthammer]
Eg håpar dette er ein prosess som blir kjørt kvar gong stavekontrollen vert laga, i staden for at det er ein éingongsgreie. For eksempel inneheldt ordlistene frå ordbanken fleire kodingsfeil for enkelt særnamn som visstnok skal vera retta no. Nye/fiksa/fjerna ord frå ordbanken bør automatisk leggast til / fiksast / fjernast i stavekontrollen når førstnemnte vert oppdatert.
Oppdatering av databasen til no.speling.org gjøres daglig, hver gang noen sender inn korrekturleste ord via epost.
Enig i at vi bør synkronisere med ordbanken når det kommer oppdateringer der, men er usikker på hvordan vi skal gjøre det. Er det andre kilder enn ordbanken du mener vi bør synkronisere inn i no.speling.org?
Vennlig hilsen,
Petter Reinholdtsen:
Enig i at vi bør synkronisere med ordbanken når det kommer oppdateringer der, men er usikker på hvordan vi skal gjøre det.
Er det ikkje so enkelt som (konseptuelt):
for fil in $kjelder do cat $fil >> stavekontroll done
der variabelen «kjelder» inneheld dei ulike ordkjeldene.
Er det andre kilder enn ordbanken du mener vi bør synkronisere inn i no.speling.org?
I framtida kan me ha mange slike, for eksempel ei liste over vanlige geografiske namn (som kommunar.txt, fylke.txt) og personnamn (fornamn.txt og etternamn.txt, med dei vanligaste fornamn og etternamna).
[Karl Ove Hufthammer]
Er det ikkje so enkelt som (konseptuelt):
Nei. :)
Jacob har vel sendt URL til en presentasjon han holdt om hvordan speling.org-systemet fungerer. Tror det kan være en grei start for å lære hvordan det fungerer. Ellers er kildekoden tilgjengelig for nedlasting.
Vennlig hilsen,
Karl Ove Hufthammer wrote:
Axel Bojer:
Innmelding av ord. Metoder: E-post, ord fra ordbanken og fra Rune Klevelands ordliste, innmeldinger vha. skript
Eg håpar dette er ein prosess som blir kjørt kvar gong stavekontrollen vert laga, i staden for at det er ein éingongsgreie. For eksempel inneheldt ordlistene frå ordbanken fleire kodingsfeil for enkelt særnamn som visstnok skal vera retta no. Nye/fiksa/fjerna ord frå ordbanken bør automatisk leggast til / fiksast / fjernast i stavekontrollen når førstnemnte vert oppdatert.
Det vil helt sikkert bli et behov mht. ordbanken, den versjonen vi har nå inkluderer ikke endringene fra 2005, og de vil vi veldig gjerne ha med.
Ble dette gjort med et skript som kan gjenbrukes? I så fall hvor ligger det?
Hilsen Axel
[Axel Bojer]
Det vil helt sikkert bli et behov mht. ordbanken, den versjonen vi har nå inkluderer ikke endringene fra 2005, og de vil vi veldig gjerne ha med.
Ble dette gjort med et skript som kan gjenbrukes? I så fall hvor ligger det?
Det ble ikke gjort med et script. Jeg hentet ut alle ordene for henholdvis bokmål og vha. cut -fN (husker ikke hvilket felt det var), kopierte filen over til tyge og kjøre et script for å generere fila som speling.org trenger og kopierte den fila over til riktig sted på tyge.
Vennlig hilsen,
Petter Reinholdtsen wrote:
[Axel Bojer]
Det vil helt sikkert bli et behov mht. ordbanken, den versjonen vi har nå inkluderer ikke endringene fra 2005, og de vil vi veldig gjerne ha med.
Ble dette gjort med et skript som kan gjenbrukes? I så fall hvor ligger det?
Det ble ikke gjort med et script. Jeg hentet ut alle ordene for henholdvis bokmål og vha. cut -fN (husker ikke hvilket felt det var), kopierte filen over til tyge og kjøre et script for å generere fila som speling.org trenger og kopierte den fila over til riktig sted på tyge.
Der har vi altså en oppgave til for stavekontrollprosjektet :-) Vi bør med tiden får laget et skript der alt dette er med, og det er fint det sies hvordan dette gjøres. Kan du peke til hvilket skript du brukte (på thyge), som en referanse til neste gang dette skal gjøres? :-) Har du en nøyaktig nettadresse til der du fant den? ( under http://tyge.sslug.dk/ et sted?)
Jeg tror det er viktig å dokumentere så mye som mulig slik at det blir lettere for andre å bidra.
Hilsen Axel