Om møtet -------- Jeg var i dag på møte i Norsk språkråd om norske ordlister, og sitter generelt sett igjen med en positiv opplevelse av møtet og viljen til å frigi datene. Det gjelder f.eks. Bokmålsordboka og Nynorskordboka på nett, men også metainformasjon om bøyninger som ikke ligger der men i en annen database der de har ca. 1,2 mill. ord [1]. Også fra UiO kan det hende det kommer bidrag, og så meg da fra Skolelinux :-) no.speling.org sitter på en liste over, så vidt jeg har forstått 1,4 mill. ord [1]. Problemet med disse er bl.a. at de ikke er kvalitetssikret fullt ut og at de ikke er oppdatert etter endringene som kom i 2005. Håpet er at så mange som mulig av de ordlistene som finnes allerede skal slås sammen til en, men da må lisens- og rettighetsspørsmålet løses først (hvem skal ha hvilke rettigheter og hvilken tilgang på hvilken måte).
Om rettigheter og eierskap --------------------------- Vi snakket mye om brukerrettigheter og eierskap/-rettigheter. Jeg fortalte om GNU-lisensen dobbelte frihet: Frihet til å bruke og frihet til å endre, samtidig også forpliktelsen for de som endrer til, hvis de offentliggjør endringer, også å gjøre dem fritt tilgjengelig på samme vis som det de selv arbeidet videre fra. Det var stor enighet om at denne nye norske samledatabasen med ord skal være gratis, altså ikke forbehold de med penger. Det så ut til at de fleste med dette mente at hvem som helst kan gjøre hva de vil med ordene, også legge dem inn i sitt eget program uten å melde tilbake endringer. Jeg nevnte at GNU-lisensen åpner for dobbellisensiering (som med QT), altså at de som vil bruke koden videre i et lukket rpodukt (ikke vil melde tilbake endringer) må betale, alle andre får det gratis og fritt tilgjengelig. Noen tok dette poenget, spesielt da jeg nevnte muligheten av at en ny stavekontroll for f.eks. Microsoft kunne være bedre enn den «offisielle» fra Språkrådet. Men noen mente også at dette bare åpner for sunn konkurranse om å levere det beste produktet, siden grunnlaget er fritt tilgjengelig for alle (mer i retning av BSD-lisensen, men det sa jeg ikke :-).
Hva som ønskes / vyer --------------------- Hvis noen har tanker eller synspunkter som ikke er nevnt, så kom gjerne med dem, jeg skal se hva jeg kan bringe videre. Det har også tidligere vært snakket løst og uforpliktende om å lage flere databaser/lister f.eks. for kjemiord, dataord o.l. slik at man kan koble til de ordlistene man trenger, kanskje til og med krysse av i en boks fra gang til gang hvilke ordlister man vil stavekontrollere med. Dette minsker antall uoppdagede feil, altså ord du har feilstavet men som allikevel finnes i databasen[2]. Det er selvfølgelig også ønskelig med hjelp i speling.org prosjektet til å oppdatere ordliste så den svarer til siste normendirnger fra Språkrådet :-)
Noter ----- 1: Disse tallene baserer seg på såkalte fullformer, altså ikke bare bil, men bilen, biler, bilens o.s.v. Det er trygt å si at 100-200.000 ord gir omtrent 1,2 mill ord i fullform. 2: typisk tror som feilstaves ror blir ikke understreket, hadde ror vært et fagord kunne man unngått det ved å koble fra denne fagordbasen. indiksjon og induksjon kunne kanskje vært et slikt eksempel?
Mvh Axel