On Fri, 11 Nov 2005 02:00:49 +0100, Børre Gaup boerre@skolelinux.no wrote:
Takk for en glimrende redegjørelse, Børre! Denne burde også vært sendt til den norske oversetterlisten, siden den inneholder informasjon som er av interesse for dem.
Det samiske språkteknologiprosjektet ved UiTø[2] bruker transdusere.
En transduser kan, i tillegg til å fortelle om en gitt streng kan bli generert av automaten eller ikke, også fortelle hvilke grammatiske egenskaper denne strengen kan ha. En streng som "for" i norsk kan f.eks. ha svært mange grammatiske egenskaper:
for+konjunksjon (for å gå) for+preposisjon (for en sum penger) for+substantiv (vi trenger for til fiskene) for+fortid av verb (han for i går)
substantivet bør skrives «fôr», mener jeg. Og skrives ikke verbet «fór»? Aksenter er undervurdert på bokmål! Hvis grammatikkontrollen kunne foreslå aksenter i slike tilfelle, hadde jeg likt den. :-)
Skal vi f.eks. ha en grammatikkontroll må vi kunne skille mellom de ulike "for", og for å gjøre det trenger vi en transduser.
Når retteprogrammet gjør så omfattende vurderinger er det vel ikke tilstrekkelig å vise frem en liste med alternativer til brukeren når det ikke er opplagt hva brukeren har ment? Det er ikke sikkert brukeren skjønner uten å bli presentert eksempler, eller bli henvist til en ordbok.
- Samarbeid?
Det samiske språkteknologiprosjektet ved UiTø har laget en infrastruktur med dokumentasjon, cvs, osv. som blir brukt til å implementere modeller for nord-, lule- og sør-samisk. I tillegg er arbeid med å implementere grønlandsk og komi i gang (finansiert og gjennomført av andre enn UiTø) innenfor denne infrastrukturen.
Kanskje er norskmiljøet (i første omgang) innenfor skolelinux interessert i ta del av denne infrastrukturen, og implementere norske lingvistiske modeller vha. SFTS?
Dette høres svært interessant ut. Som jeg skrev øverst; dette skulle også vært postet til den norske listen. Jeg tror tyskerne vil ha minst like stor nytte av en slik teknologi, og de har antagelig utviklere som har noe å tilføre, også.
[1] http://hunspell.sourceforge.net/ [2] http://giellatekno.uit.no/ [3] http://www.xrce.xerox.com/competencies/content-analysis/fst/home.en.html [4] http://www.ims.uni-stuttgart.de/projekte/gramotron/SOFTWARE/SFST.html
Noen tyskere er inne i loopen, ser jeg. Jeg ville anbefalt å knytte kontakter i det tyske Skolelinux-miljøet. Det er flere Debianister i Tyskland, og utviklerne møtes oftere der.