On 2/14/07, Jacob Sparre Andersen sparre@sslug.dk wrote:
Har du læst http://edb.jacob-sparre.dk/problems_with_the_current_speling_org_system? Afsnit 5.5 forklarer hvordan vi kan overføre data fra det nuværende system til et der er mere grammatikbevidst.
Nei, den visste jeg ikke om. Interessant, og dekker det meste av det jeg har ttenkt på, og en god del mer.
Ja. Men med »ROOT«-feltet kan du kæde de forskellige former sammen.
[...]
Derfor er det nyttigt at vi bruger felterne »ROOT« og »CONJUGATION«.
Tillater meg å stokke litt om på dine kommentarer her:
- At vi i korrekturlesinga prøvde å sørge for at ROOT var med, selv om resten av bøyningsfeltene ikke er det
Det lyder som en fornuftig plan.
(kan jeg få ROOT med i utsendinga, forresten?)
Det kan du godt, men det kræver at vi går ind og indsætter en ny linje under linje 209 i »export_editor-specific_unchecked_log«. Og så vil det i første omgang betyde at alle korrekturlæserne får »ROOT«-feltet med.
I tråd med det som er skrevet over vil jeg si dette er en stor fordel!
Henrik Christian Grove har skrevet programmet »dte« (http://www.sslug.se/%7Egrove/dte/index.shtml), som vi er nogle stykker, der bruger til vores korrekturlæsning. Med det kan man skrive en korrekturlæsningspost som:
WORD: (formands|korrekturlæsnings|udgifts|udsigts)?=post#som bil STATUS: + EDITOR: Jacob Sparre Andersen
Og (i Vi) med tastetrykkene »:%!LANG=da_DK dte« få det foldet ud til 391 linjer med i alt 40 stavemåder af 5 ord:
WORD: post STATUS: + CONJUGATION-RULE: som abe EDITOR: Jacob Sparre Andersen ROOT: post CONJUGATION: Ubestemt ental CLASS: Navneord, fælleskøn
WORD: posts STATUS: + CONJUGATION-RULE: som abe EDITOR: Jacob Sparre Andersen HYPHENATION: post!s ROOT: post CONJUGATION: Ejefald af ubestemt ental CLASS: Navneord, fælleskøn
[...]
Det gør korrekturlæsningen lidt lettere, samtidig med at det giver lidt ekstra grammatiske oplysninger.
Nyttig! Skal se nærmere på det.
- Er det rimelig å ha alle genitiv-s-former i ordlista?
Alle dem som folk bruger.
Burde ikke slike former indikeres som en tillatt avledning av grunnformen istedenfor? Norsk er da ikke det eneste språket som gjør denslags.
Det er også sådan det ender med at stå i den affikskomprimerede ordliste til Ispell. Men hvordan vil du holde styr på hvilke ord det er tilladt at føje et ejefalds-s til?
Uten at jeg kjenner verktøyene som skal brukes til å behandle korrekturen er det vanskelig å komme med et praktisk forslag, men jeg kunne tenke meg det kan gjøres med et felt som indikerer hvilken (eller hvilke?) genitivformer som er tillatte.
WORD: bil GENITIV: =s
WORD: hus GENITIV: ='
men jeg vet ikke hvordan det skal fungere sammen med bøyningsmønstre.
Stavekontrolprogrammerne er netop _stave_kontrolprogrammer. De interesserer sig således ikke for grammatik. Så længe det primære projekt er at gøre ordlisten bedre til stavekontrol, er felter som »ROOT« og »CLASS« af begrænset nytte.
Det er vel rett hva angår ispell og lignende. En stavekontroll som skal kunne skille mellom "være" og "været" er avhengig av å interessere seg for grammatikk.
[...]
Det kan vi godt gøre, men det er sådan set med vilje at systemet tager lidt tilfældigt rundt i samlingen. Hvis du vil generere samlede blokke, kan jeg anbefale »dte«. Der er ikke en opsætningsfil til bokmål endnu, men jeg er sikker på at Henrik gerne giver lidt råd om hvordan du kan skrive en på grundlag af den danske opsætningsfil.
Det kan jeg godt kikke på.
Det jeg gør er at jeg af og til henter en kopi af ordlisten (kildetekst+oversat udgave) ned på min egen maskine. Der kan jeg så bruge »grep« og andre, mere specifikke værktøjer på filerne.
Hvor finner jeg denne?
God fornøjelse,
Jacob
Takk,