Har dere sett at nasjonalbiblioteket klager i Digi over at Språkbanken er for lite brukt?
<URL: https://www.digi.no/artikler/slakter-database-det-er-brukt-atte-ar-og-72-mil... >
Hadde ikke hørt at de hadde publisert disse datasettene før jeg leste artikkelen, så det er kanskje ikke så veldig rart at den ikke har vært mye brukt. Jeg er over normalt interessert i slikt, og har altså ikke fått det med meg. Fant den på <URL: https://www.nb.no/forskning/sprakbanken/ >.
Skulle ønske de hadde satt bruksvilkår uten begrensninger, f.eks. PDDL, i stedet for slike 'kun for akademinsk bruk' vilkår på store deler av datasettene.
Petter Reinholdtsen pere@hungry.com čálii:
Har dere sett at nasjonalbiblioteket klager i Digi over at Språkbanken er for lite brukt?
Korleis veit dei kor mykje Språkbanken er brukt, eigentleg? Sjølv om dei sporer nedlastingar, så ser dei jo ikkje kopiane som blir tatt av den igjen, eller kva det blir til. T.d. er dei norske bitane av https://www.apertium.org/ hovudsakleg basert på Norsk ordbank og Oslo-Bergen-taggeren (som du kan lasta ned frå Språkbanken).
Ordbanken og ordnettet er forresten CC-BY, n-gram er CC-ZERO – kva er det som er under «akademisk bruk»?
[Kevin Brubeck Unhammer]
Korleis veit dei kor mykje Språkbanken er brukt, eigentleg?
Ingen aning.
Ordbanken og ordnettet er forresten CC-BY, n-gram er CC-ZERO – kva er det som er under «akademisk bruk»?
For eksempel alt merket 'ACA' på <URL: https://www.nb.no/sprakbanken/repositorium >.
-- Vennlig hilsen Petter Reinholdtsen
Vi har brukt disse i flere år, men vi er ikke Google og da teller vi ikke? (å få ut dataene for en privat organisasjon var heller ikke enkelt i starten)
De har ikke noe system for oppdatering/feilretting, så videre utvikling skjer på egne systemer.
De klager over å ikke få satse på tale, men de har et gammel datasett fra NST (2003) som inneholder fonetiske data. Dette er ikke videreført.
Vil foreslå at de retter fokuset utover, hva er det "kunden" ønsker 😊
-frode
-----Opprinnelig melding----- Fra: i18n-no-bounces@lister.ping.uio.no i18n-no-bounces@lister.ping.uio.no På vegne av Petter Reinholdtsen Sendt: 4. desember 2018 20:55 Til: i18n-no@lister.ping.uio.no Emne: [i18n-no] Nasjonalbiblioteket klager over at Språkbanken er for lite brukt
Har dere sett at nasjonalbiblioteket klager i Digi over at Språkbanken er for lite brukt?
<URL: https://www.digi.no/artikler/slakter-database-det-er-brukt-atte-ar-og-72-mil... >
Hadde ikke hørt at de hadde publisert disse datasettene før jeg leste artikkelen, så det er kanskje ikke så veldig rart at den ikke har vært mye brukt. Jeg er over normalt interessert i slikt, og har altså ikke fått det med meg. Fant den på <URL: https://www.nb.no/forskning/sprakbanken/ >.
Skulle ønske de hadde satt bruksvilkår uten begrensninger, f.eks. PDDL, i stedet for slike 'kun for akademinsk bruk' vilkår på store deler av datasettene.
-- Vennlig hilsen Petter Reinholdtsen
_______________________________________________ E-postlista i18n-no i18n-no@lister.ping.uio.no https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
Petter Reinholdtsen pere@hungry.com čálii:
[Kevin Brubeck Unhammer]
Ordbanken og ordnettet er forresten CC-BY, n-gram er CC-ZERO – kva er det som er under «akademisk bruk»?
For eksempel alt merket 'ACA' på <URL: https://www.nb.no/sprakbanken/repositorium >.
Dei er frå Clarino: https://uni.no/en/uni-computing/clu/clarino/ Det er litt forvirrande at både språkbanken-greier og Clarino er på same side, men det gjer iallfall Clarino meir tilgjengeleg enn det elles ville vore …
Det ser forresten ut som Nav bruker Norsk ordbank òg, via spaCy: https://github.com/explosion/spaCy/pull/3007
(og spaCy er forøvrig i stor grad brukt kommersielt: https://explosion.ai/blog/spacy-user-survey )
som igjen viser kor vanskeleg det er å måla brukarar – kor mange av dei som bruker spaCy kjem til å vita (eller bry seg om) at ordlistene for bokmål kom frå Språkbanken?
Med det sagt, så hadde det vore nyttig om Språkbanken gjorde det tydelegare korleis dei ønsker samarbeid – kor kan eg opna issues og senda patches? Tidlegare har eg sendt e-post med rettingar til ordbanken og Oslo–Bergen-taggaren direkte til dei eg veit har jobba med det (@iln.uio.no), men eg har ikkje alltid fått svar, og eg neste utgåve tok så lang tid å komma at det ikkje lenger var viktig for meg om endringane mine kom med eller ikkje. Og https://www.nb.no/sprakbanken/show?serial=oai%3Anb.no%3Asbr-5&lang=en t.d. har ikkje ein gong dei e-postadressene, så eg reknar med dei fleste berre har sine private forks utan å senda tilbake rettingar.
Kevin Brubeck Unhammer skreiv 06.12.2018 14:49:
Med det sagt, så hadde det vore nyttig om Språkbanken gjorde det tydelegare korleis dei ønsker samarbeid – kor kan eg opna issues og senda patches?
Det står under «Vis utvida metadata → Resource common info → Contact → Actor info → Communication info». For eksempel for ordbanken (https://www.nb.no/sprakbanken/show?serial=oai%3Anb.no%3Asbr-41&lang=nn):
Email: sprakbanken@nb.no Url: https://www.nb.no/forskning/sprakbanken Address: Henrik Ibsens gate 110 Postboks 2674 Solli Zip code: NO-0203 City: Oslo Country: Norway
Men viss det gjeld feil i bøyingane, ordtilfanget eller leddanalysen, er det betre å senda ein e-post til ordbokene@uib.no.
Tidlegare har eg sendt e-post med rettingar til ordbanken og Oslo–Bergen-taggaren direkte til dei eg veit har jobba med det (@iln.uio.no), men eg har ikkje alltid fått svar,
Eg hadde same erfaring. Men etter at ansvaret for ordbøkene vart flytta til UiB, har eg alltid fått svar, og raskt svar (gjerne neste dag), når eg har meldt frå om feil til ordbokene@uib.no.
og eg neste utgåve tok så lang tid å komma
Ifølgje dei ansvarlege skal den nedlastbare versjonen av ordbanken oppdaterast to gongar i året (noko eg synest er litt sjeldan). Ein ny versjon skal vera rundt hjørnet, og vil endeleg òg inkludera leddanalysefiler.
Karl Ove Hufthammer karl@huftis.org čálii:
Kevin Brubeck Unhammer skreiv 06.12.2018 14:49:
Med det sagt, så hadde det vore nyttig om Språkbanken gjorde det tydelegare korleis dei ønsker samarbeid – kor kan eg opna issues og senda patches?
Det står under «Vis utvida metadata → Resource common info → Contact → Actor info → Communication info». For eksempel for ordbanken (https://www.nb.no/sprakbanken/show?serial=oai%3Anb.no%3Asbr-41&lang=nn):
Eg prøvde å finna det på nettsidene no. Fint filter for å sørga for at du berre får dei mest uthaldande og motiverte bidragsytarane :-/
Karl Ove Hufthammer karl@huftis.org čálii:
Kevin Brubeck Unhammer skreiv 06.12.2018 14:49:
Med det sagt, så hadde det vore nyttig om Språkbanken gjorde det tydelegare korleis dei ønsker samarbeid – kor kan eg opna issues og senda patches?
Det står under «Vis utvida metadata → Resource common info → Contact → Actor info → Communication info». For eksempel for ordbanken (https://www.nb.no/sprakbanken/show?serial=oai%3Anb.no%3Asbr-41&lang=nn):
Eg prøvde å finna det på nettsidene no. Fint filter for å sørga for at du berre får dei mest uthaldande og motiverte bidragsytarane :-/
Strengt tatt så er vel dette kun standard kontaktinfo, _ikke_ informasjon om hvor/hvordan man registrere feil og sende oppdateringer. Prøv f.eks. url.
-frode