Gode dykk,
Eg har akkurat oppdatert nynorskomsetjinga av Rockbox (rockbox.org), og det skal lagast talesyntese-filer av omsetjingane. Utviklarane føreslår å bruke Piper, og der finst ei norsk røyst, men ho er ikkje spesielt god på å lesa nynorsk.
Eg veit at Nasjonbalbiblioteket bruker Hulda, men det ser ikkje ut som den er ope tilgjengeleg. Finst det open talesyntese som gjev brukbart nynorsk?
Helsing og god påske
Eivind Ødegård
Eivind Ødegård via l10n-no skreiv 02.04.2026 16:47:
Gode dykk,
Eg har akkurat oppdatert nynorskomsetjinga av Rockbox (rockbox.org), og det skal lagast talesyntese-filer av omsetjingane. Utviklarane føreslår å bruke Piper, og der finst ei norsk røyst, men ho er ikkje spesielt god på å lesa nynorsk.
Eg veit at Nasjonbalbiblioteket bruker Hulda, men det ser ikkje ut som den er ope tilgjengeleg. Finst det open talesyntese som gjev brukbart nynorsk?
Må det vera /open/ talesyntese? Eg har god erfaring med Hulda frå CereProc for generering av ferdige lydfiler, men det er eit kommersielt system.
Eg har førebels brukt det i programma GCompris, KTuberling (Potetfyren) og Tux Paint. Det er heilt i orden å distribuera dei ferdige lydfilene under for eksempel GPL-lisensen (eg har fått dette stadfesta av kundestøtta til CereProc).
Ein fordel med bruk av slik talesyntese (i motsetning til meir moderne KI-basert talesyntese) er at ein kan spesialtilpassa uttalen for enkeltorda som ikkje vert uttalte rett som standard. Ein brukar ei slags lydskrift, og med litt øving (og prøving og feiling) går det ganske greitt å skriva inn rett uttale for orda. Det er dette som gjer at velkomstmeldinga i GCompris på nynorsk («Velkommen til GCompris!») klarar å uttala GCompris nokolunde rett.
Eg har kjøpt nokre /credits/ for ein rimeleg penge, og dei er nok til generering av /mange/ lydfiler. Så eg kan godt bruka nokon av dei resterande til å laga lydfiler for Rockbox, om det er av interesse. Eg har laga eit system for generering av slike lydfiler, og som eg synest fungerer godt. Kort sagt har ein éi tekstfil per lydfil, og innhaldet i tekstfila er teksten som skal uttalast. I tillegg kan ein ha nokre korreksjonsfiler for ord som skal uttalast på ein annan måte. Og så er det berre å skriva «make» for å automatisk generera alle lydfilene (og koda dei om til for eksempel .opus-filer).
Hei Karl Ove, og takk for raskt og grundig svar.
Den 02.04.2026 18:05, skreiv Karl Ove Hufthammer via l10n-no:
Må det vera /open/ talesyntese?
Hmnei, det er vel ingenting som seier at det *må* vera det, anna enn at det sjølvsagt er fint dersom det går an å få generert nynorsk tale med opne program i det heile.
Eg har god erfaring med Hulda frå CereProc for generering av ferdige lydfiler, men det er eit kommersielt system.
Ja, og det er vel dette Nasjonalbiblioteket bruker òg, Eg synest tilbodet ditt om å laga nynorske talefiler til Rockbox er veldig generøst, så eg seier i utgangspunktet ja takk til det, men eg fekk ein annan ide òg:
For fleire år sidan las eg inn nynorskutgåva av språklæringsappen og -nettsida 50languages.com. Eg har framleis lydfilene frå denne innlesinga, og tekstfilene som rekneark. Det er over 1000 frasar, så korpuset er ikkje heilt lite. Ideen min er om det går an å bruke dette til å trene Piper til å laga ei ny røyst(1), som så kunne bli teken med i Piper? Dermed kunne Rockbox-folka bruke røysta til å laga talefilene sjølve, og me ville ha ei ope tilgjengeleg røyst til å generere nynorsk tale for framtida.
Problemet mitt er at dette ligg eit par hakk over det eg greier teknisk å få til sjølv. Dersom Karl Ove eller nokon andre har lyst til å hjelpe til med å trene Piper, skal eg med glede gjera tilgjengeleg lyd- og tekstfilene eg sit på.
Beste helsing
Eivind Ø.
1: https://github.com/OHF-Voice/piper1-gpl/blob/main/docs/TRAINING.md