[Håvard Korsvoll]
Trur ikkje vi treng å starte på nytt. Alt kan fiksast ved å reinske kjeldefila.
Jeg håper det. Men jeg tror alle ordene som ligger inne fra Rune Klevelands liste bør oppdateres fra norsk.words til å få med orddelingstegnet. Hvis de har '-' i norsk.words, så skal de ha '=' for å markere hvor de er sammensatt av flere ord. I tillegg er det mange flere ord i norsk.words enn som har kommet med i source.gz.
Men vi er vel eit stykke unna frå å aktivt rekruttere folk til innsats enno. Det er ein del som bør fiksast først. Her er ei liste som eg synes bør vere for det meste oppfylt.
- Bli einige om format på ordklassar og bøyingsformer.
- Spikre alle format på felta i filformatet, og godt dokumentert.
- Resultat og statistikkar tilgjengeleg på web.
- Mulighet for enklare bidrag (berre godkjenne eller avvise ord).
- Eit byggesystem for listene.
- Autentisere bidrag, eventuelt mulighet til å spore kven som bidrar.
- Mulighet til å bidra ved hjelp av nettlesar.
Lista ser bra ut, selv om jeg tror vi skal være svært forsiktige med å legge listen for høyt når det gjelder autentisering (punkt 6).
Det bør i tillegg inn to punkt:
- Oppdatere "originalordene" som kom fra Rune Klevelands liste til å inneholde ordsammensetning og type ord.
- Legge inn alle bokmålsordene fra Rune Klevelands liste som mangler.
Slik det er no kan alle sende inn bidrag utan å leggje inn noko i EDITOR:-feltet, og då er mulighetene for å misbruke systemet stort.
Det er jo ikke stort, da ord må godkjennes av flere. Vi kunne med fordel ha endret opplegget slik at from-feltet i mailen brukes hvis EDITOR-feltet mangler, eventuelt logget / forkastet mail der from-feltet ikke stemmer med envelope-from og editor-feltet.
Ei webbasert løysing bør ha ein innloggingsfunksjon. Men det kan vere nok at brukaren sjølv opprettar ein konto utan at nokon treng å godkjenne vedkomande.
Slik selv-registrering er det på URL:http://www.dicts.info/dictlist1.php?k1=620, der det var svært enkelt å både komme igang og å bidra. Vi bør tilstrebe noe lignende.
Punkt 5 er vel ikkje så mykje arbeid. Petter har vel lært seg det gamle byggesystemet etterkvart og det er vel ikkje så mykje som skal til får å bruke det på det nye. Det som er jobben er å automatisere dette.
Jeg har ikke sett på hvordan source.gz skal brukes til å bygge ordliste, men håper og tror at de andre som bruker speling-scriptene allerede har laget det som trengs. Jeg kan bidra, men ser helst at noen andre med mer tid til overs følger opp byggingen.