Jeg har tenkt å skrive et innlegg til avisene der jeg oppfordrer regjeringen til å frigjøre orddatabasen til dokpro, slik at den kan brukes til å forbedre den fritt tilgjengelige stavekontrollen. Hvilke punker bør jeg ha med?
Jeg oppfordrer alle andre til å også skrive innlegg om dette, slik at det får større oppmerksomhet i opunionen. De færreste erklar over at dette er et problem.
Her er mine strekpunkter så langt.
- dokumentasjonsprosjektet sitter på orddatabasen - begrenset websøk finnes allerede - fritt tilgjengelige stavekontroll - brukes av Skolelinux, OpenOffice.org, FireFix, Thunderbird, Mac OSX - 12 stykker korrekturleser på dugnad - Ferdig med 6000 ord, 750000 ord igjen - frigjør databasen - liste med korrekt stavede ord på web - fjern bruksbegrensningene på websøket - legg info om ordklasse og bøyningsinformasjon på web
Vennlig hilsen,
Petter Reinholdtsen skrev:
Jeg har tenkt å skrive et innlegg til avisene der jeg oppfordrer regjeringen til å frigjøre orddatabasen til dokpro, slik at den kan brukes til å forbedre den fritt tilgjengelige stavekontrollen. Hvilke punker bør jeg ha med?
Jeg oppfordrer alle andre til å også skrive innlegg om dette, slik at det får større oppmerksomhet i opunionen. De færreste erklar over at dette er et problem.
Her er mine strekpunkter så langt.
- dokumentasjonsprosjektet sitter på orddatabasen
- begrenset websøk finnes allerede
- fritt tilgjengelige stavekontroll
- brukes av Skolelinux, OpenOffice.org, FireFix, Thunderbird, Mac OSX
- 12 stykker korrekturleser på dugnad
- Ferdig med 6000 ord, 750000 ord igjen
- frigjør databasen
- liste med korrekt stavede ord på web
- fjern bruksbegrensningene på websøket
- legg info om ordklasse og bøyningsinformasjon på web
Vennlig hilsen,
Er enig i alt dette. Men etter å ha vært i møte med språkrådet (og flere andre aktører) om saken, så var så vidt jeg forsto konklusjonen at dette var ønsket. Vet ikke hvor offisielt dette er ... Men de har altså litt ulike grunner for de ulike punktene du påpeker. Håper de kan gi et offisielt svar på det :-) Mulig de da kan fortelle hvor denne saken står nå. Jeg skrev et referat fra møtet som ligger i e-postarkivet: https://lister.ping.uio.no/pipermail/lister.ping.uio.no/i18n-no/2006-April/0... https://lister.ping.uio.no/pipermail/lister.ping.uio.no/i18n-no/2006-June/00... http://wiki.debian.org/SpellNorwegian/PresentasjonSpr%c3%a5kr%c3%a5d
(Vi burde forøvrig hatt ett nytt irc-møte med status og veien videre. Er det stemning for det?)
Men litt purring på saken skader sikkert ikke. Minimum burde være oppheving av sperren de har på antall søk som er mulig per minutt slik at man kan sjekke ord vha. skripting. Dette vil i praksis si en frigivelse, skjønt ord ikke har opphavsrett (unntatt produktnavn, men det glemmer vi her), bare en bestemt bruk av dem. Dermed burde dette være mulig allerede nå selv om den fullstendige frigivelsen tar byråkratisk mye tid :-/
Noe om at dette er statlig («skattebetalernes penger» :-)) og dermed burde frigis alle, norsk språk burde ikke være forbeholdt de med penger, spesialavtaler e.l. med gis ut gratis til alle, særlig når det altså er offentlige midler som er blitt brukt.
Mvh Axel
Axel Bojer skrev: (...)
(Vi burde forøvrig hatt ett nytt irc-møte med status og veien videre. Er det stemning for det?)
Dette ble nok uklart, jeg mente altså et møte i stavekontrollprosjektet :-)
[Axel Bojer]
Er enig i alt dette. Men etter å ha vært i møte med språkrådet (og flere andre aktører) om saken, så var så vidt jeg forsto konklusjonen at dette var ønsket. Vet ikke hvor offisielt dette er ... Men de har altså litt ulike grunner for de ulike punktene du påpeker. Håper de kan gi et offisielt svar på det :-) Mulig de da kan fortelle hvor denne saken står nå.
Poenget med mitt debattinnlegg er å gjøre regjeringen og andre klar over at dette er et problem. Jeg snakked med folk i IKT-Norge på torsdag, og de kjente ikke til problemstillingen. Jeg tror nemlig saken må opp på departementsnivå for å få en løsning. Jeg tror de fleste er positive til å gi folket tilgang uten bruksbegrensinger, men så lenge det ikke er en løsning på finansieringsproblemet er det ikke sansynlig at det kommer endringer.
(Vi burde forøvrig hatt ett nytt irc-møte med status og veien videre. Er det stemning for det?)
Jeg tror det er lurt, spesielt på bakgrunn av av nynorsk-korrekturlesingen ser ut til å være stoppet opp.
Men litt purring på saken skader sikkert ikke. Minimum burde være oppheving av sperren de har på antall søk som er mulig per minutt slik at man kan sjekke ord vha. skripting. Dette vil i praksis si en frigivelse, skjønt ord ikke har opphavsrett (unntatt produktnavn, men det glemmer vi her), bare en bestemt bruk av dem.
Jeg tror du tar feil her. Katalogvernet i opphavsrettsloven vil beskytte databasen og hindre oss i å bruke den til automatisk korrekturlesing, selv om det ikke er tekniske sperrer som hindrer oss i å slå opp alle ordene vi har i vår database der.
Vennlig hilsen,
Petter Reinholdtsen skrev:
[Axel Bojer]
(...)
(Vi burde forøvrig hatt ett nytt irc-møte med status og veien videre. Er det stemning for det?)
Jeg tror det er lurt, spesielt på bakgrunn av av nynorsk-korrekturlesingen ser ut til å være stoppet opp.
Ok. Noen som har forslag til hvilke dager og tider som passer?
Men litt purring på saken skader sikkert ikke. Minimum burde være oppheving av sperren de har på antall søk som er mulig per minutt slik at man kan sjekke ord vha. skripting. Dette vil i praksis si en frigivelse, skjønt ord ikke har opphavsrett (unntatt produktnavn, men det glemmer vi her), bare en bestemt bruk av dem.
Jeg tror du tar feil her. Katalogvernet i opphavsrettsloven vil beskytte databasen og hindre oss i å bruke den til automatisk korrekturlesing, selv om det ikke er tekniske sperrer som hindrer oss i å slå opp alle ordene vi har i vår database der.
Hva sier katalogvernet helt spesifikt? Da det finnes flere ordbøker på markedet som naturlig nok bruker det samme ordtilfanget, så er det vel tydelig at det ikke er ordene man har opphavsrett til, men en bestemt bruk av dem. Definisjoner av et ords betydning er nærmere en tekst i egentlig forstand og også presise gjengivelser av ordboksoppslag, men vi bare sammenligner deres ord med våre. Når det er lov manuelt, hvorfor er det ikke lov elektronisk?
Men hvordan det nå enn er burde de si fra seg begrensningsretten til dette (om den finnes, som du beskriver), så databasen blir en slags allmenning :-)
Mvh Axel
[Axel Bojer]
Hva sier katalogvernet helt spesifikt?
Jeg siterer fra URL:http://www.lovdata.no/all/tl-19610512-002-041.html#43:
§ 43. Den som frembringer et formular, en katalog, en tabell, et program, en database eller lignende arbeid som sammenstiller et større antall opplysninger, eller som er resultatet av en vesentlig investering, har enerett til å råde over hele eller vesentlige deler av arbeidets innhold ved å fremstille eksemplar av det og ved å gjøre det tilgjengelig for allmennheten.
Eneretten etter første ledd gjelder tilsvarende ved gjentatt og systematisk eksemplarfremstilling eller tilgjengeliggjøring for allmennheten av uvesentlige deler av arbeid som nevnt, dersom dette utgjør handlinger som skader den normale utnyttelse av arbeidet eller urimelig tilsidesetter frembringerens legitime interesser.
Eneretten til et arbeid som nevnt i første ledd varer i 15 år etter utløpet av det år arbeidet ble fremstilt. Dersom arbeidet i løpet av dette tidsrom offentliggjøres varer vernet i 15 år etter utløpet av det år arbeidet første gang ble offentliggjort.
Er arbeid som nevnt foran, helt eller for en del gjenstand for opphavsrett, kan også denne gjøres gjeldende.
Bestemmelsene i §§ 2 andre og tredje ledd,¹ 6 til 8, 11a til 22, 25, 27, 28, 30 til 38b og 39h fjerde og femte ledd gjelder tilsvarende.
Avtale som utvider frembringerens rett etter første ledd til et offentliggjort arbeid kan ikke gjøres gjeldende.
1 Skulle være andre til fjerde ledd.
vi bare sammenligner deres ord med våre. Når det er lov manuelt, hvorfor er det ikke lov elektronisk?
Jeg er ikke sikker, men tror vi bør trå forsiktig for å unngå å havne i en juridisk hengemyr.
Vennlig hilsen,
* Axel Bojer axelb@skolelinux.no [2006-11-18]:
Petter Reinholdtsen skrev:
Jeg har tenkt å skrive et innlegg til avisene der jeg oppfordrer regjeringen til å frigjøre orddatabasen til dokpro, slik at den kan brukes til å forbedre den fritt tilgjengelige stavekontrollen. Hvilke punker bør jeg ha med?
[kutt]
Noe om at dette er statlig («skattebetalernes penger» :-)) og dermed burde frigis alle, norsk språk burde ikke være forbeholdt de med penger, spesialavtaler e.l. med gis ut gratis til alle, særlig når det altså er offentlige midler som er blitt brukt.
Helt enig - dette er gyldige og gode poenger.
Hans
Laurdag 18 november 2006 09:46 skreiv Petter Reinholdtsen:
Jeg har tenkt å skrive et innlegg til avisene der jeg oppfordrer regjeringen til å frigjøre orddatabasen til dokpro, slik at den kan brukes til å forbedre den fritt tilgjengelige stavekontrollen. Hvilke punker bør jeg ha med?
Jeg oppfordrer alle andre til å også skrive innlegg om dette, slik at det får større oppmerksomhet i opunionen. De færreste erklar over at dette er et problem.
Her er mine strekpunkter så langt.
- dokumentasjonsprosjektet sitter på orddatabasen
- begrenset websøk finnes allerede
- fritt tilgjengelige stavekontroll
- brukes av Skolelinux, OpenOffice.org, FireFix, Thunderbird, Mac OSX
- 12 stykker korrekturleser på dugnad
- Ferdig med 6000 ord, 750000 ord igjen
- frigjør databasen
- liste med korrekt stavede ord på web
- fjern bruksbegrensningene på websøket
- legg info om ordklasse og bøyningsinformasjon på web
Vennlig hilsen,
Referer gjerne også frigjevinga av norske kartdata som eg meinar foregår no.
Mvh, Lars Ivar Igesund
Takk for gode innspill. Her er førsteutkastet til leserbrev om stavekontrollen og behov for å frigjøre datagrunnlaget. Mulig det bør gjøres om til en pressemelding og sendes bredt ut i NUUG-regi. CC til NUUG-styret for innspill på dette derfra.
Sett det norske språk fri =========================
For at de norske skriftspråk skal overleve i dagens digitale Norge trenger det hjelp. Velfungerende stavekontroll i elektroniske skriveverktøy er en viktig måte å hjelpe språket vårt. For å lage stavekontroll for bokmål og nynorsk trengs det blant annet en liste med alle korrekt stavede norske ord. For at de dugnadsutviklede programvareprosjektene Skolelinux, OpenOffice.org, Firefox og Thunderbird skal ha best mulig stavekontroll må en slik liste over ord være tilgjengelig uten bruksbegrensninger. Stavekontrollen for bokmål og nynorsk som brukes i disse programmene utvikles på dugnad.
En slik liste vedlikeholdes av enhet for digital dokumentasjon (EDD) ved Universitetet i Oslo i samarbeid med Språkrådet, men den er ikke tilgjengelig uten bruksbegrensninger.
Derfor jobber nå frivillige i fri programvaremiljøet på dugnad for å lage en liste med alle korrekt stavede bokmål- og nynorskord. De foreløbig 12 frivillige er i gang med å korrekturlese den fritt tilgjengelige listen med 750 000 ord. Vi har så langt fått sjekket ca. 6000 ord, så det gjenstår mye før vi er ferdige. Hver dag spør vi oss om hvorfor dette dobbeltarbeidet er nødvendig når ordlistene som trengs allerede eksisterer hos EDD, finansiert nesten utelukkende med offentlige midler.
EDD vokter daglig over det norske språk. De har bygget opp en organisasjon som tar imot tips om nye ord, og lager i samarbeidet med språkrådet en oversikt over hvilke ord som er i bruk i dag. Basert på disse listene med ord lages det ordbøker både på web og papir. Webutgaven er tilgjengelig for alle som ikke bruker den for mye. Hvis den brukes for ofte, stenges nettadressen til brukeren ute. De legger ikke ut listen med korrekt stavede ord med tilhørende ordklasse og bøyningsinformasjon. Årsaken til disse bruksbegresningene er blant annet avtaler med forlagene som har enerett på papirutgaven av ordbøkene for bokmål og nynorsk. I tillegg er det en bekymring om de fortsatt vil ha finansiering til å beholde de ansatte som gjør jobben med å vedlikeholde orddatabasen hvis resultatet legges ut for nedlasting.
Hvis kulturdepartementet og språkrådet mener det norske språk er verdt å ta vare på, så bør de straks få lagt ut listene i ren tekst med korrekt stavede bokmål og nynorskord for nedlasting via web med en lisens uten bruksbegrensiner. Det er også en fordel om informasjon om ordklasser og bøyningsinformasjon gjøres tilgjengelig på tilsvarende vis. De bør også sørge for at bruksbegrensingene i søketjenesten for ordbøkene fjernes. Samtidig bør de sørge for at de som vedlikeholder disse offisielle orddatabasene er sikret finansiering til å fortsette vedlikeholdet.
Hvis dette ble gjort med en akseptabel lisens, så vil vi i dugnadsprosjektet som lager fri programvare-utgaven av stavekontrollen skrinlegge vårt dobbeltarbeide og bruke de offisielle listene til å forbedre stavekontrollen for bokmål og nynorsk som brukes linux-distribusjoner og alle ande fri programvareprosjekter som har stavekontroll.
Petter Reinholdtsen Leder i NUUG og dugnadsarbeider for den norske stavekontrollen
Petter Reinholdtsen skrev:
Takk for gode innspill. Her er førsteutkastet til leserbrev om stavekontrollen og behov for å frigjøre datagrunnlaget. Mulig det bør gjøres om til en pressemelding og sendes bredt ut i NUUG-regi. CC til NUUG-styret for innspill på dette derfra.
Selv takk for et fint brev. Det aller meste ser veldig bra ut, men noen små kommentarer:
Sett det norske språk fri
For at de norske skriftspråk skal overleve i dagens digitale Norge
Kanskje bedre: De norske skriftspråkene
trenger det hjelp. Velfungerende stavekontroll i elektroniske
-> _En_ velfungerende ... tror jeg er bedre.
skriveverktøy er en viktig måte å hjelpe språket vårt. For å lage
Jeg ser denne skrivemåten er veldig vanlig etterhvert, men heter det ikke «en måte å hjelpe språket _på_»? Mulig denne kommentaren er litt akademisk :-)
stavekontroll for bokmål og nynorsk trengs det blant annet en liste med alle korrekt stavede norske ord. For at de dugnadsutviklede programvareprosjektene Skolelinux, OpenOffice.org, Firefox og Thunderbird skal ha best mulig stavekontroll må en slik liste over ord
Komma foran «må»
være tilgjengelig uten bruksbegrensninger. Stavekontrollen for bokmål og nynorsk som brukes i disse programmene utvikles på dugnad.
En slik liste vedlikeholdes av enhet for digital dokumentasjon (EDD)
«Enhet for digital dokumentasjon» (EDD) er kanskje tydeligere ...
ved Universitetet i Oslo i samarbeid med Språkrådet, men den er ikke tilgjengelig uten bruksbegrensninger.
Derfor jobber nå frivillige i fri programvaremiljøet på dugnad for å lage en liste med alle korrekt stavede bokmål- og nynorskord. De foreløbig 12 frivillige er i gang med å korrekturlese den fritt
-> foreløpig :-)
tilgjengelige listen med 750 000 ord. Vi har så langt fått sjekket ca. 6000 ord, så det gjenstår mye før vi er ferdige. Hver dag spør vi oss om hvorfor dette dobbeltarbeidet er nødvendig når ordlistene som trengs allerede eksisterer hos EDD, finansiert nesten utelukkende med offentlige midler.
EDD vokter daglig over det norske språk. De har bygget opp en organisasjon som tar imot tips om nye ord, og lager i samarbeidet med
-> i samarbeid
språkrådet en oversikt over hvilke ord som er i bruk i dag. Basert på disse listene med ord lages det ordbøker både på web og papir.
Både her og i det følgende vil jeg foretrekke at vi holder oss til «nett», «nettet» og «nettutgavene» istedenfor sammenstillinger med importordet «web» :-) Det er også det ordet vi bruker i oversettelsene. Du skriver jo også «nettadressen», så da blir det mer enhetlig også.
Webutgaven er tilgjengelig for alle som ikke bruker den for mye. Hvis den brukes for ofte, stenges nettadressen til brukeren ute. De legger ikke ut listen med korrekt stavede ord med tilhørende ordklasse og bøyningsinformasjon. Årsaken til disse bruksbegresningene er blant
-> bruksbegrensningene
annet avtaler med forlagene som har enerett på papirutgaven av ordbøkene for bokmål og nynorsk. I tillegg er det en bekymring om de fortsatt vil ha finansiering til å beholde de ansatte som gjør jobben med å vedlikeholde orddatabasen hvis resultatet legges ut for nedlasting.
Er du sikker på dette punktet? Da jeg stilte dette spørsmålet på møtet virket det som de mente noe annet.
Hvis kulturdepartementet og språkrådet mener det norske språk er verdt å ta vare på, så bør de straks få lagt ut listene i ren tekst med korrekt stavede bokmål og nynorskord for nedlasting via web med en lisens uten bruksbegrensiner. Det er også en fordel om informasjon om
-> bruksbegrensninger
ordklasser og bøyningsinformasjon gjøres tilgjengelig på tilsvarende vis. De bør også sørge for at bruksbegrensingene i søketjenesten for ordbøkene fjernes. Samtidig bør de sørge for at de som vedlikeholder disse offisielle orddatabasene er sikret finansiering til å fortsette vedlikeholdet.
Hvis dette ble gjort med en akseptabel lisens, så vil vi i dugnadsprosjektet som lager fri programvare-utgaven av stavekontrollen skrinlegge vårt dobbeltarbeide og bruke de offisielle listene til å forbedre stavekontrollen for bokmål og nynorsk som brukes
-> brukes i
linux-distribusjoner og alle ande fri programvareprosjekter som har stavekontroll.
Mvh Axel Bojer
[Axel Bojer]
Selv takk for et fint brev. Det aller meste ser veldig bra ut, men noen små kommentarer:
Takk for nyttig korrekturlesing. Jeg har lagt inn alle endringene dine. Har opprettet <URL: http://wiki.skolelinux.de/nuug/dokumenter/pm-2006-12-stavekontroll > med siste utgave.
Skal gå igjennom Håvards punkter nå.
Er du sikker på dette punktet? Da jeg stilte dette spørsmålet på møtet virket det som de mente noe annet.
Nei, jeg har antagelig fisket det ut av luften. Fjernet det.
Vennlig hilsen,
Den 30. nov. 2006 kl. 11.17 skrev Petter Reinholdtsen:
Hvis kulturdepartementet og språkrådet mener det norske språk er verdt å ta vare på, så bør de straks få lagt ut listene i ren tekst med
Eg veit ikkje om dette med 'ren tekst' er noko poeng - dersom det er koda i eit tekstformat (t.d. xml), kan kodinga ha ein stor verdi i seg sjølv. Men eg føreslår at 'i ren tekst' blir stroke, så kan ein seinare diskutera formatet dei bør leggjast ut i. Det er ein detalj i samanhengen, det viktige no er å få departementet til å ta til seg prinsippet om at offentleg finansierte ressursar bør vera offentleg tilgjengelege utan restriksjonar.
Eg tykkjer du bør senda brevet ikkje berre til departementa, men òg som lesarinnlegg til dei største avisene. Eit ope brev med stor offentleg spreiing set meir press på departementet enn dersom det berre går rett til dei.
Sjur