Hei
No har eg tilbakestilt orddatabasen (hadde heldigvis tatt vare på ein kopi med Latin1), kjeldefila var øydelagt.
Eg har også fått inn ein del e-post frå folk som ynskjer å vere med. Eg har lagt dei inn i korrekturlesarlista, så dei skal få e-post i morgon.
Ein ting som enno ikkje fungerer er viss folk sender inn ein e-post som er MIME/multipart (typisk html-melding). Men det øydelegg ingenting, får berre ein merknad i loggen «Content type is not text/plain».
Det som hadde vore fint å lage er eit filter som standardiserer litt ulike stave/skrivemåtar på ordklassar, ordbøyingar og andre felt. Eg ser at danskane har dette, men det er programmert i ada og er ferdigkompilert. Kjelda har eg ikkje sett på enno. Dette tar vi etterkvart når vi ser kva som havnar i databasen.
Eg har lagt pressemeldinga ut på linux1.no :)
Håvard
Håvard Korsvoll skrev:
Det som hadde vore fint å lage er eit filter som standardiserer litt ulike stave/skrivemåtar på ordklassar, ordbøyingar og andre felt. Eg ser at danskane har dette, men det er programmert i ada og er ferdigkompilert.
Noget af det er i det mindste i Ada. Der er også noget (grim) Perl-kode.
Kjelda har eg ikkje sett på enno.
/home/sparre/Ada/Programmer/CGI/Ordlisten/harmonize_danish_cgi_log.adb
Vi burde nok snarere klare det i Perl.
Jacob
On 3/1/06, Jacob Sparre Andersen sparre@sslug.dk wrote:
Håvard Korsvoll skrev:
Det som hadde vore fint å lage er eit filter som standardiserer litt ulike stave/skrivemåtar på ordklassar, ordbøyingar og andre felt. Eg ser at danskane har dette, men det er programmert i ada og er ferdigkompilert.
Noget af det er i det mindste i Ada. Der er også noget (grim) Perl-kode.
Kjelda har eg ikkje sett på enno.
/home/sparre/Ada/Programmer/CGI/Ordlisten/harmonize_danish_cgi_log.adb
Vi burde nok snarere klare det i Perl.
Jepp, det har eg sett.
Viss du vil bruke mottaksskriptet vårt for å kunne ta i mot QUOTED PRINTABLE, så kan du finne det på /var/speling.org/nn/bin/read_mail.pl
Håvard
[Håvard Korsvoll]
No har eg tilbakestilt orddatabasen (hadde heldigvis tatt vare på ein kopi med Latin1), kjeldefila var øydelagt.
Hvordan var det egentlig du konverte filen i første omgang? Noen ide om hva som gikk galt?
Det er visst fortsatt noe galt med filen. Jeg lastet nettopp ned URL:http://tyge.sslug.dk/%7Ekorsvoll/nb.speling.org/htdocs/status/source.gz, og der ser jeg at flere av synonym-linjene er korrupt. Se f.eks. etter 'sprÂk=vitenskap', 'l¯pt', 'gj¯k' og 'lÊrd'. Det er flere ord med problemer enn de jeg nevnte her.
Eg har også fått inn ein del e-post frå folk som ynskjer å vere med. Eg har lagt dei inn i korrekturlesarlista, så dei skal få e-post i morgon.
Hurra! Vi trenger mange for å rekke over de 500k ordene som skal sjekkes på bokmål og nynorsk. :)
Ein ting som enno ikkje fungerer er viss folk sender inn ein e-post som er MIME/multipart (typisk html-melding). Men det øydelegg ingenting, får berre ein merknad i loggen «Content type is not text/plain».
Burde det gå en mail tilbake til avsender med beskjed om dette?
Eg har lagt pressemeldinga ut på linux1.no :)
Nydelig. :) Jeg har ikke sett den noe annet sted. :(