Tenkte eg skulle tipsa om eit lite skript eg synest er veldig nyttig ved omsetting. Av og til lurer ein på kva form eit ord har i ulike bøyingar (opp med handa dei som på ståande fot kan bøya «å late» korrekt i presens, preteritum og imperativ på nynorsk, *med* aksentar).
Til dette er det greitt å bruka fullformslistene til Norsk ordbank, som er gjevne ut under GPL: http://www.edd.uio.no/prosjekt/ordbanken/
Eg brukar følgjande heimesnekra skript. Kall det for eksempel «ord»:
#!/bin/sh ordbok=~/utvikling/ordbok/nn/fullform_nn.txt awk '{ if ( $2 == '"$1"') {print $0}}' $ordbok \ | fgrep -v klammeform | fgrep -v unormert \ | grep -E " <?$2" | grep -E " <?$3" | grep -E " <?$4" | grep -E " <?$5"
Dette tar inn *grunnforma* av eit ord, samt (starten på) eventuelle formkodar. Unormerte ord (må innrømma eg ikkje er heilt sikkert på nøyaktig kva det er) og klammeformer vert ekskluderte, sidan me ikkje skal bruka dei i omsettingane våre. (For bokmål kan du fjerna filtreringa av klammeformer, sidan bokmål ikkje lenger har skilje mellom klammeformer og hovudformer.)
Eksempel på bruk:
ord ringje
Dette gjev alle bøyingar av ordet «ringje». Me kan òg avgrensa oss til enkelte former. Lat oss tenka oss at me skal omsetta meldinga «Read messages» (namnet på ei mappe), men er litt usikkert på om perfektum partisipp-forma er «leste» eller «lesne». Då kan me skriva:
ord lese perf
Dette gjev alle desse treffa:
55153 lese lesi verb perf-part <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 7 55153 lese lese verb perf-part <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 7 55153 lese lesi adj <perf-part> nøyt ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 8 55153 lese lese adj <perf-part> nøyt ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 8 55153 lese lesen adj <perf-part> m/f ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 9 55153 lese lesen adj <perf-part> m/f ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 9 55153 lese lesi adj <perf-part> fem ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 10 55153 lese lesi adj <perf-part> fem ub eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 10 55153 lese lesne adj <perf-part> bu eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 11 55153 lese lesne adj <perf-part> bu eint <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 11 55153 lese lesne adj <perf-part> fl <intrans1> <trans1> <trans11/opp> <part1/ut> normert 304 12 55153 lese lesne adj <perf-part> fl <intrans1> <trans1> <trans11/opp> <part1/ut> normert 305 12
Svaret er altso at «Read messages» må bli «Lesne meldingar».
Som me ser, får me ofte *mange* treff. Me kan filtrera vidare. Skal for eksempel namnet på mappa med meldingar ein har sendt heita «Sendte meldingar» eller «Sende meldingar»? Svar:
ord send perf fl
78673 sende sende adj <perf-part> fl <trans1> <ditrans1> <ditrans4> <ditrans5/etter> <part1/bort> <part1/rundt> <part1/ut> <adv6> <adv7> <trans11/adv3> <trans11/etter> normert 087 12
Det heiter altso «Sende meldingar» (men om ein skriv privat, kan ein bruka «Sendte meldingar», som er ei klammeform).
Nokre nyttige kodar: adj/verb/subst (sjølvforklarande) eint/fl (eintal/fleirtal) bu/ub (bunden/ubunden form) pres/pret/perf/imp (presens/preteritum/perfektum/imperativ)
Det finst òg andre. Til slutt: Svaret på oppgåva om verbbøyinga av «å late» er, i høvesvis presens, preteritum og imperativ:
lèt lét lat