On Tue, 2011-01-25 at 20:54 +0100, Sigmund Hansen wrote:
• «Hun fortalte sine /barn eventyr/ hver onsdag.» • «Han solgte /Arne sykkelen/ sin.»
3: Han solgte Arne naboens sykkel. :)
Takk for eksempler.
Jeg skal se om vi kan få opp languagetool-grammatikksjekking av norske wikipediasider; da vil vi sikkert få veldig mange falske positiver, ihvertfall til reglene blir mer gjennomtenkt :D
Da er spørsmålet om dette er vanligere enn særskrivning? Og hva skiller dette fra særskrivning, så vi ev. kan lage en regel som oppdager når det er det ene og når det andre?
Man må da kartlegge transitivitet til verb, så man kan gjøre en analyse av setningsleddene.
Om det: Languagetool har en fast rutine for sjekking av setninger.
1) Teksten deles opp i hele setninger (avsluttet med punktum eller ny linje). Lett.
2) Linjene deles opp i ord. Lett.
3) Ordene tildeles "part-of-speech"-merkelapp (tag) (grammatikalsk funksjon?) eksempel: "biler"=(substantiv, flertall, ubestemt) ELLER (verb,presens)
---------------------------- Det er vel her brorparten av tenkingen må gjøres, så ordene får rett merkelapper tildelt. ----------------------------
4) Regler kjøres over de oppdelte setningene ---------------------------- Regler er bra, men hvis merkelappene er feil, vil nok reglene slå ut feil også. ----------------------------
se også http://www.languagetool.org/development/
Tror jeg ville tatt kontakt med de som håndterer programmet for Informatikk: språk og kommunikasjon på UiO. studieinfo@ifi.uio.no tar seg av ev. videresending. Kan jo hende det kunne være interesse for dem å utlyse det som en masteroppgave, men de liker jo å ha en ekstern veileder. :/
Høres ut som en god idé. Hvis de trenger en ekstern veileder, må jo denne også hjelpe prosjektet :D
Arno