* Trond Trosterud (2006-03-13 09:12):
Viss det er slik at alle verb dannar imperfektum partisipp med suffikset -ende/-ande til stammen, er det like greitt å ikkje operere med separat bolk, men heller operere med eit suffiks for kvart verb, som gjev, ikkje eit verb, men eit adjektiv. Som adjektiv har det ein del særtrekk (det er ubøyeleg). Det vi ikkje vil ha, er to opne kategoriar der vi klarer oss med ein. Dette er ein uheldig konsekvens av Erik sitt framlegg.
Mitt råd er altså: Produktiv avleiiing bør vere del av morfologien, men formene bør taggast som avleiingar.
Eg er samd i dette. Problemet er at det ikkje er definert noko morfologisk system her, det er berre tale om å klassifisera ordformer til opplysning for brukaren. Slik eg ser det har det noverande opplegget nokre alvorlege veikskapar:
- Den grammatiske informasjonen som blir registrert no er tilnærma verdilaus for ein intelligent stavekontroll, den einaste bruken er til opplysning for brukaren.
- Det finst ikkje noko fullstendig omgrep om ord i databasen. Ein kan ikkje skilja ulike ord(former) med same skrivemåte eller sjå kva for ord ei ordform høyrer til.
- Det er ineffektivt å gjera same arbeidet opp att for alle bøyingsformer, slikt som å leggja inn synonym og bøyingsmønster bør det vera nok å gjera ein gong per ord.
- Det er ikkje laga noko opplegg for å merka klammeformer, det gjer at stavekontrollen ikkje vil kunna brukast i det offentlege, eller alternativt ikkje i skulen dersom klammeformene blir haldne utanfor (gjeld nynorsk).
Dessutan er det ikkje lagt opp til å registrera kjønn av substantiv. Danskane legg det inn i CLASS saman med ordklassen.
Eg arbeider no med ei løysing det skal vera nok med ei registrering per ord, og der alle bøyingsformer, produktive avleiingar, skrivemåtar og side- og hovudformer kan produserast automatisk ut frå informasjonen som registrert om ordet. Det er ein heil del arbeid igjen før eg er i mål. Eg skal koma attende med meir informasjon når eg har noko å demonstrera.
Dinest har eg tenkt å sjølv gå laus på alle lukka ordklassar og avgrensa delar av dei opne ordklassane, til dømes ord med uregelrett bøying og sterke verb. Etter dette vil berre den keisame jobben med å registrera dei store mengdene av regelrette verb, substantiv og adjektiv stå att.
Berre så det er sagt: eg tykkjer ikkje at nokon skal leggja ned arbeidet og venta på noko frå meg, det er godt mogleg eg har teke meg vatn over hovudet. Me får sjå.
Eg er forresten forhindra frå å vera med på IRC-møtet i kveld.
Erik