2010/3/25 Kevin Brubeck Unhammer p.ixiemotion@gmail.com:
2010/3/25 christian leon christensen chrleon@gmail.com:
I fjor sendte jeg en epost til Fornyings- og administrasjonsdepartemenetet, hvor jeg spurte om Talesystemer på norsk, og om det var noen planer å å utvikle frie systemer.
Jeg fikk svar fra daværende fornyingsminister Heidi Grande Røys:
Hei, og takk for din henvendelse
Da jeg lanserte den første Stortingsmeldingen om IT-politikken noensinne, kalte jeg den ”Eit informasjonssamfunn for alle”. Universell utforming av IKT er en viktig del av dette, og høyt prioritert av meg og regjeringen. Mulighet for å oversette fra tekst til tale er viktig for mange IKT-brukere med nedsatt syn eller lesevansker, og er et viktig virkemiddel for å gjøre IKT tilgjengelig for alle.
I 2006 kom jeg med en generell utfordring om til miljøene som jobber med IKT-plattformer om å tilby norsk talesyntese som en del av løsningen. Hittil er det bare Microsoft som har svart på denne utfordringen. At de gjorde det var jeg selvsagt fornøyd med, og ønsket å vise dette ved å bidra til lansering av løsningen. Jeg vil imidlertid understreke at vi ikke har inngått noen avtale med Microsoft om at de skal gjøre dette, og heller ikke betalt for at de skal tilby denne funksjonaliteten. Om løsningen skal gjøres tilgjengelig for brukere av andre plattformer må det derfor være opp til Microsoft selv å avgjøre.
Dette forsto eg ikkje heilt. Det er då ikkje Microsoft som har rettane til Språkbanken.
Språkbanken inneheld altså, i tillegg til mykje anna snadder, 5000 setningar opplest av same person, mynta på tekst-til-tale. Dette skal det fint vere mogleg å lage eit unit-selection-system av med Festival (unit selection gir den beste lyden, viss det finst nok taledata å basere det på). Men lisensen til Språkbanken er, såvidt eg kan sjå med lekmannsauge, ikkje kompatibel med nokon open kjeldekode-lisens.
Er altså problemet heller at ingen har komme med eit skikkeleg prosjektforslag?
mvh, Kevin Brubeck Unhammer
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
Jeg tillater meg å kryss-poste til oversettelseslisten for norsk språk, i18n-no@lister.ping.uio.no
Etter det jeg kan lese på: http://www.spraakbanken.uib.no/utredninger.page http://www.sprakrad.no/Tema/IKT--sprak/Handlingsplan-for-norsk-sprak-og-IKT/ og http://www.daisy.org/project/pipeline er Daisy Pipeline en av måtene myndighetene vil tilgjengeliggjøre tekst til tale for alle på.
Er det noen som har forsøkt Daisy Pipelie eller relaterte produkter? Kan dette samarbeide med Festival på noen måte?
Jeg kan lite om talesyntese, men jeg vet at én av de viktigste tingene for FLOSS-miljøet er at vi får en løsning vi kan bruke i systemene våre. Og at den er god.
Hvis Daisy kan integreres med eksisterende FLOSS programvare, for eksempel KDE, Gnome, Festival og andre, er vi vel i mål, eller i alle fall halvveis der? Det kan jo være hyggelig å velge mellom ulike stemer, og ikke bare bruke Brage hele tiden.
Hvis ikke har vi mye lobby-virksomhet foran oss.
;)Frode
Frode Severin Hatlevik frodeseverin@gmail.com writes:
2010/3/25 Kevin Brubeck Unhammer p.ixiemotion@gmail.com:
2010/3/25 christian leon christensen chrleon@gmail.com:
I fjor sendte jeg en epost til Fornyings- og administrasjonsdepartemenetet, hvor jeg spurte om Talesystemer på norsk, og om det var noen planer å å utvikle frie systemer.
Jeg fikk svar fra daværende fornyingsminister Heidi Grande Røys:
Hei, og takk for din henvendelse
Da jeg lanserte den første Stortingsmeldingen om IT-politikken noensinne, kalte jeg den ”Eit informasjonssamfunn for alle”. Universell utforming av IKT er en viktig del av dette, og høyt prioritert av meg og regjeringen. Mulighet for å oversette fra tekst til tale er viktig for mange IKT-brukere med nedsatt syn eller lesevansker, og er et viktig virkemiddel for å gjøre IKT tilgjengelig for alle.
I 2006 kom jeg med en generell utfordring om til miljøene som jobber med IKT-plattformer om å tilby norsk talesyntese som en del av løsningen. Hittil er det bare Microsoft som har svart på denne utfordringen. At de gjorde det var jeg selvsagt fornøyd med, og ønsket å vise dette ved å bidra til lansering av løsningen. Jeg vil imidlertid understreke at vi ikke har inngått noen avtale med Microsoft om at de skal gjøre dette, og heller ikke betalt for at de skal tilby denne funksjonaliteten. Om løsningen skal gjøres tilgjengelig for brukere av andre plattformer må det derfor være opp til Microsoft selv å avgjøre.
Dette forsto eg ikkje heilt. Det er då ikkje Microsoft som har rettane til Språkbanken.
Språkbanken inneheld altså, i tillegg til mykje anna snadder, 5000 setningar opplest av same person, mynta på tekst-til-tale. Dette skal det fint vere mogleg å lage eit unit-selection-system av med Festival (unit selection gir den beste lyden, viss det finst nok taledata å basere det på). Men lisensen til Språkbanken er, såvidt eg kan sjå med lekmannsauge, ikkje kompatibel med nokon open kjeldekode-lisens.
Er altså problemet heller at ingen har komme med eit skikkeleg prosjektforslag?
mvh, Kevin Brubeck Unhammer
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
Jeg tillater meg å kryss-poste til oversettelseslisten for norsk språk, i18n-no@lister.ping.uio.no
Etter det jeg kan lese på: http://www.spraakbanken.uib.no/utredninger.page http://www.sprakrad.no/Tema/IKT--sprak/Handlingsplan-for-norsk-sprak-og-IKT/ og http://www.daisy.org/project/pipeline er Daisy Pipeline en av måtene myndighetene vil tilgjengeliggjøre tekst til tale for alle på.
Er det noen som har forsøkt Daisy Pipelie eller relaterte produkter? Kan dette samarbeide med Festival på noen måte?
Jeg kan lite om talesyntese, men jeg vet at én av de viktigste tingene for FLOSS-miljøet er at vi får en løsning vi kan bruke i systemene våre. Og at den er god.
Hvis Daisy kan integreres med eksisterende FLOSS programvare, for eksempel KDE, Gnome, Festival og andre, er vi vel i mål, eller i alle fall halvveis der? Det kan jo være hyggelig å velge mellom ulike stemer, og ikke bare bruke Brage hele tiden.
Hvis ikke har vi mye lobby-virksomhet foran oss.
Hei!
Mulig jeg kommer med informasjon som allerede er kjent, men for sikkerhets skyld:
Det er Norsk lyd- og blindeskriftsbibiliotek, <nlb.no> som har utviklet talesyntesen Brage i samarbeid med sin svenske søsterorganisasjon. Se http://www.nlb.no/sitepageview.aspx?articleID=10 under overskriften "Produksjon", og http://www.nlb.no/sitepageview.aspx?articleID=58. Den siste lenken viser til en pressemelding der det også er oppgitt kontaktinformasjon som kan være nyttig.
Hvis jeg ikke tar helt feil, så brukes Daisy Pipeline til å konvertere bøker til DAISY-format. NLB bruker Brage på en sørver for å generere lydbøker med kunstig tale. Det ville vært fint hvis koden til talesyntesen kunne blitt frigitt, for det tror jeg ikke den er.
Lars
2010/3/26 Lars Bjørndal lars.bjorndal@broadpark.no:
Frode Severin Hatlevik frodeseverin@gmail.com writes:
2010/3/25 Kevin Brubeck Unhammer p.ixiemotion@gmail.com:
2010/3/25 christian leon christensen chrleon@gmail.com:
I fjor sendte jeg en epost til Fornyings- og administrasjonsdepartemenetet, hvor jeg spurte om Talesystemer på norsk, og om det var noen planer å å utvikle frie systemer.
Jeg fikk svar fra daværende fornyingsminister Heidi Grande Røys:
Hei, og takk for din henvendelse
Da jeg lanserte den første Stortingsmeldingen om IT-politikken noensinne, kalte jeg den ”Eit informasjonssamfunn for alle”. Universell utforming av IKT er en viktig del av dette, og høyt prioritert av meg og regjeringen. Mulighet for å oversette fra tekst til tale er viktig for mange IKT-brukere med nedsatt syn eller lesevansker, og er et viktig virkemiddel for å gjøre IKT tilgjengelig for alle.
I 2006 kom jeg med en generell utfordring om til miljøene som jobber med IKT-plattformer om å tilby norsk talesyntese som en del av løsningen. Hittil er det bare Microsoft som har svart på denne utfordringen. At de gjorde det var jeg selvsagt fornøyd med, og ønsket å vise dette ved å bidra til lansering av løsningen. Jeg vil imidlertid understreke at vi ikke har inngått noen avtale med Microsoft om at de skal gjøre dette, og heller ikke betalt for at de skal tilby denne funksjonaliteten. Om løsningen skal gjøres tilgjengelig for brukere av andre plattformer må det derfor være opp til Microsoft selv å avgjøre.
Dette forsto eg ikkje heilt. Det er då ikkje Microsoft som har rettane til Språkbanken.
Språkbanken inneheld altså, i tillegg til mykje anna snadder, 5000 setningar opplest av same person, mynta på tekst-til-tale. Dette skal det fint vere mogleg å lage eit unit-selection-system av med Festival (unit selection gir den beste lyden, viss det finst nok taledata å basere det på). Men lisensen til Språkbanken er, såvidt eg kan sjå med lekmannsauge, ikkje kompatibel med nokon open kjeldekode-lisens.
Er altså problemet heller at ingen har komme med eit skikkeleg prosjektforslag?
mvh, Kevin Brubeck Unhammer
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
Jeg tillater meg å kryss-poste til oversettelseslisten for norsk språk, i18n-no@lister.ping.uio.no
Etter det jeg kan lese på: http://www.spraakbanken.uib.no/utredninger.page http://www.sprakrad.no/Tema/IKT--sprak/Handlingsplan-for-norsk-sprak-og-IKT/ og http://www.daisy.org/project/pipeline er Daisy Pipeline en av måtene myndighetene vil tilgjengeliggjøre tekst til tale for alle på.
Er det noen som har forsøkt Daisy Pipelie eller relaterte produkter? Kan dette samarbeide med Festival på noen måte?
Jeg kan lite om talesyntese, men jeg vet at én av de viktigste tingene for FLOSS-miljøet er at vi får en løsning vi kan bruke i systemene våre. Og at den er god.
Hvis Daisy kan integreres med eksisterende FLOSS programvare, for eksempel KDE, Gnome, Festival og andre, er vi vel i mål, eller i alle fall halvveis der? Det kan jo være hyggelig å velge mellom ulike stemer, og ikke bare bruke Brage hele tiden.
Hvis ikke har vi mye lobby-virksomhet foran oss.
Hei!
Mulig jeg kommer med informasjon som allerede er kjent, men for sikkerhets skyld:
Det er Norsk lyd- og blindeskriftsbibiliotek, <nlb.no> som har utviklet talesyntesen Brage i samarbeid med sin svenske søsterorganisasjon. Se http://www.nlb.no/sitepageview.aspx?articleID=10 under overskriften "Produksjon", og http://www.nlb.no/sitepageview.aspx?articleID=58. Den siste lenken viser til en pressemelding der det også er oppgitt kontaktinformasjon som kan være nyttig.
Hvis jeg ikke tar helt feil, så brukes Daisy Pipeline til å konvertere bøker til DAISY-format. NLB bruker Brage på en sørver for å generere lydbøker med kunstig tale. Det ville vært fint hvis koden til talesyntesen kunne blitt frigitt, for det tror jeg ikke den er.
Det var slik eg au forsto det. Eg vil tru at Daisy Pipeline + Brage i beste fall kan nyttast som software-as-a-service (eew).
Altså, om eg var svaksynt ville eg nok heller hatt ein rask robotstemme frå espeak el. installert lokalt enn å måtte vente på at ein ekstern tenar genererte lyden og sendte han over internett for Kvar Einaste Linje på nettsida eg ser på… For å få eit inntrykk av kor rask ein stemme bør kunne vere:
http://emacspeak.blogspot.com/2007/09/emacspeak-video-demo-looking-up-weathe...
mvh, Kevin Brubeck Unhammer
[Lars Bjørndal]
Mulig jeg kommer med informasjon som allerede er kjent, men for sikkerhets skyld:
Nytt for meg, i hvert fall. Jeg ser lenkene allerede har funnet veien til <URL: http://wiki.nuug.no/Taleteknologi >, så noen visste det fra før. :)
Det ville vært fint hvis koden til talesyntesen kunne blitt frigitt, for det tror jeg ikke den er.
Jepp. Lurer på hvem som har rettighetene til denne koden...
Vennlig hilsen,
Jeg har ikke fulgt dette temaet nøye, men har litt informasjon å bidra med likevel.
Skolelinux-miljøet skrev i 2007 en prosjektsøknad om midler til å lage bedre syntetisk stemmegenerering for norsk. Den søknaden er tilgjengelig fra URL:http://developer.skolelinux.no/brev/tekst-til-tale_friprog-FAD-20071113-v1.0.pdf
Den omtalte Henrik-stemmen i søknaden er siden dan gang så vidt jeg vet overtatt av universitetetene og Uninett, som vurderer hva de kan bruke den til. Et alternativ er å gi ut datagrunnalget med en fri lisens, men for at det skal være ekstra attraktivt trengs det noen som har en plan for hva de skal bruke datakilden til hvis den frigis. En god kontakt her er Walter M. Tveter ved USIT som har sett litt på saken fra Universitetet i Oslos side.
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
wiki.skolelinux.no brude kunne brukes, eller en kan bruke wiki.nuug.no hvis en vil gjennomføre prosjektet i NUUG-regi.
Når det gjelder Daisy-formatet var det en studentgruppe i Skolelinux som så på dette i 2006. Prosjektet ble aldri ferdig nok til å få noen utbredelse, men grunnlaget finnes tilgjengelig fra <URL: http://developer.skolelinux.no/info/studentgrupper/2006-hig-daisyplayer/ >. Daisy-formatet er i grunnen HTML-sider og lydfiler med kryssreferanser basert på tidskoder, og ingen heksekunst å forholde seg til. :)
Vennlig hilsen,
Jeg glemte å nevne ADRIANE, en linux-distro laget av Knaus Knopper for blinde. Den ble presentert for NUUG i 2007, og der kan en blant annet oppleve høyttalende OpenOffice.org på nynorsk. Video er tilgjengelig fra <URL: http://www.nuug.no/aktiviteter/20071211-accessibility/ >.
Vennlig hilsen,
2010/3/26 Petter Reinholdtsen pere@hungry.com:
Jeg har ikke fulgt dette temaet nøye, men har litt informasjon å bidra med likevel.
Skolelinux-miljøet skrev i 2007 en prosjektsøknad om midler til å lage bedre syntetisk stemmegenerering for norsk. Den søknaden er tilgjengelig fra URL:http://developer.skolelinux.no/brev/tekst-til-tale_friprog-FAD-20071113-v1.0.pdf
Den omtalte Henrik-stemmen i søknaden er siden dan gang så vidt jeg vet overtatt av universitetetene og Uninett, som vurderer hva de kan bruke den til. Et alternativ er å gi ut datagrunnalget med en fri lisens, men for at det skal være ekstra attraktivt trengs det noen som har en plan for hva de skal bruke datakilden til hvis den frigis. En god kontakt her er Walter M. Tveter ved USIT som har sett litt på saken fra Universitetet i Oslos side.
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
wiki.skolelinux.no brude kunne brukes, eller en kan bruke wiki.nuug.no hvis en vil gjennomføre prosjektet i NUUG-regi.
Då har eg samla litt informasjon på http://wiki.nuug.no/Taleteknologi :-)
mvh, Kevin
On 26/03/10 15:56, Kevin Brubeck Unhammer wrote:
2010/3/26 Petter Reinholdtsen pere@hungry.com:
Jeg har ikke fulgt dette temaet nøye, men har litt informasjon å bidra med likevel.
Skolelinux-miljøet skrev i 2007 en prosjektsøknad om midler til å lage bedre syntetisk stemmegenerering for norsk. Den søknaden er tilgjengelig fra URL:http://developer.skolelinux.no/brev/tekst-til-tale_friprog-FAD-20071113-v1.0.pdf
Den omtalte Henrik-stemmen i søknaden er siden dan gang så vidt jeg vet overtatt av universitetetene og Uninett, som vurderer hva de kan bruke den til. Et alternativ er å gi ut datagrunnalget med en fri lisens, men for at det skal være ekstra attraktivt trengs det noen som har en plan for hva de skal bruke datakilden til hvis den frigis. En god kontakt her er Walter M. Tveter ved USIT som har sett litt på saken fra Universitetet i Oslos side.
PS. Er det nokon som kjenner til ein passande wiki kor me kan dokumentere informasjon om taleteknologi for norsk?
wiki.skolelinux.no brude kunne brukes, eller en kan bruke wiki.nuug.no hvis en vil gjennomføre prosjektet i NUUG-regi.
Då har eg samla litt informasjon på http://wiki.nuug.no/Taleteknologi :-)
mvh, Kevin
i18n-no mailing list i18n-no@lister.ping.uio.no https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
Dette fattet jeg interesse for, så her kommer noen innspill fra en som har en blind kamerat på GNOME med Orca. Det er forøvrig jeg som har satt opp denne løsningen for ham. Her snakker vi om både talesyntese og leselist i et grafisk miljø der brukeren stortrives.
Først og fremst ville jeg involvert FFO http://www.ffo.no/no/ i dette arbeidet. De vil i høyeste grad være i stand til å komme med argumenter og innspill.
Det har seg også slik at det finnes et begrenset antall kommersielle aktører som leverer talesyntese for norsk. Jeg tviler sterkt på at disse vil frigjøre noe med det første, men vi kan kanskje få til en fordelaktig avtale med dem? Acapella Group er en av de mest fremtredende på dette området og de leverer allerede løsninger for norsk. Litt begrenset plattformutvalg, men Tux Droid-prosjektet benytter talegjenkjenningen deres. Altså går det an å få til en kompromissløsning inntil en mer solid og åpen løsning kan tilbys av vårt miljø. Jeg har forøvrig vært i kontakt med Cepstral angående deres Swift-løsning og en mulig satsing på norsk. Det interresante med Cepstral er bl.a prisingen, men også det faktum at de er mer enn villige til å samarbeide med prosjekter som f.eks brltty.
Det har seg jo også slik at disse hjelpemidlene dekkes av det offentlige, så den første delen vil innebære å få disse til å forstå at også folk med handikapp har rett til flere valg enn et i hverdagen. Ja, det er en del lobbyvirksomhet som gjenstår her, men jeg mener at vi har et unikt ståsted når det kommer til Universell utforming med tanke på at vi har andre motiver enn voldsom profitt.
Det er allerede mange brukere med disse behovene på åpne løsninger, og jeg lover dere at de vil bli flere fremover.
Mvh Olav Dahlum
Følger opp en gammel tråd med siste melding fra 2010. I forbindelse med at Skolelinux-skoler etterlyser alternativer til lindys og lingright fra <URL: http://lingit.no/ >, tittet jeg igjen på status for Henrikstemmen som Norsk språkbank overtok fra Norsk språkteknologi da de gikk konkurs.
Stemmedatabasen er nå lagt ut for nedlasting fra <URL: http://www.nb.no/Tilbud/Forske/Spraakbanken/Tilgjengelege-ressursar/Taledata... >. Jeg har oppdatert <URL: http://wiki.nuug.no/Taleteknologi > med denne lenken. Kanskje vi da er et steg videre til en bedre talesyntese på Linux?
Jeg hadde glede av å teste installasjon av Skolelinux basert på Debian Wheezy med talesyntese, og var overrasket over hvor grei den var å forstå, selv om den var grusom å høre på og med metallisk klang.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
On 05/16/2013 04:01 PM, Petter Reinholdtsen wrote:
Følger opp en gammel tråd med siste melding fra 2010. I forbindelse med at Skolelinux-skoler etterlyser alternativer til lindys og lingright fra <URL: http://lingit.no/ >, tittet jeg igjen på status for Henrikstemmen som Norsk språkbank overtok fra Norsk språkteknologi da de gikk konkurs.
Stemmedatabasen er nå lagt ut for nedlasting fra <URL: http://www.nb.no/Tilbud/Forske/Spraakbanken/Tilgjengelege-ressursar/Taledata...
. Jeg har oppdatert <URL: http://wiki.nuug.no/Taleteknologi > med
denne lenken. Kanskje vi da er et steg videre til en bedre talesyntese på Linux?
Jeg hadde glede av å teste installasjon av Skolelinux basert på Debian Wheezy med talesyntese, og var overrasket over hvor grei den var å forstå, selv om den var grusom å høre på og med metallisk klang.
Bruker de espeak mon tro?
En gang i historien laget jeg espeak-filer for et språk, veldig metallisk men ganske god uttale tross alt.
Arno
[Arno Teigseth]
Bruker de espeak mon tro?
Ja, Debian-installasjonen bruker espeak, og hvis en installerer Gnome, så skal den også bli satt opp med talesyntese.
En gang i historien laget jeg espeak-filer for et språk, veldig metallisk men ganske god uttale tross alt.
Kanskje du kan forbedre de norske espeak-filene ved hjelp av datasettet fra språkbanken?
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
On 05/18/2013 12:17 AM, Petter Reinholdtsen wrote:
Tja, hvem vet. Men finnes norsk i repositories i det hele tatt, fra før? Uansett kan vi sikkert bruke bedre stemmer. Det verste er vel å lage uttaleregler, for Norsk er jo så forferdelig uregelmessig...
Arno
E-speak støtter norsk. Nå har det seg slik at brukerne har litt forskjellige preferanser med tanke på selve talekvaliteten, og en talesyntese vil fortsatt være underlegen naturlig tale uansett hvilken man velger. Men bedre uttale vil nok gagne blant annet E-speak med tanke på utbredelse, og jeg har venner som kan bidra med tilbakemeldinger hvis det er nødvendig. Vi kan kalle dem testere ... La også merke til at Petter nevnte Lingright og Lingdys i en annen tråd, så det kan jo lønne seg å samkjøre prosjekter med samme mål.