Trond Trosterud:
d. samle inn korpus sjølve, og bruke infrastrukturen som finst ved UiT/Divvun-prosjektet for å bearbeide korpuset og trekkje ut data
Eg kan henta ut oversikt og frekvensordlister over alle orda me har brukt i omsettingane våre (bokmål, nynorsk og nordsamisk). Det vert nok nokon hundre tusen ord …
Ved å kjøra dei mest vanlige (frekvens > 5?) orda gjennom ein stavekontroll, kan me lett både forbetra stavekontrollen og omsettingane.