Kevin Brubeck Unhammer skreiv 25.06.2021 11:38:
https://translatelocally.com/ er ei ferdig pakke med GUI og ferdigtrente modellar (nevral maskinomsetjing). Kode og data er fritt. Og i motsetning til det meste av NMT så kan det køyrast utan enorme datasenter. Ikkje så mange språkpar enno, men det ser ut som eit aktivt miljø, og norsk-modellane er overraskande bra i forhold til ressurskrav.
Korleis er kvaliteten samanlikna med for eksempel Google Translate. Altså, kva tyder «overraskande bra»?
Eg las om automatisk omsetting basert på parallellkorpus på https://www.nm.no/app/uploads/2020/03/nt-02-19.pdf. Det var då snakk om den såkalla nynorskroboten, som omset frå bokmål til nynorsk, noko som burde vore mykje enklare enn omsetting til/frå engelsk. I artikkelen står det:
I NPK og NTB har vi eit korpus på kring 40 000 tekstar som finst både på bokmål og nynorsk. Etter eit par månader såg vi at det likevel var for lite, sjølv om vi har forstått at dette er eit av dei største parallellkorpusa i Noreg. Det krev enormt mykje data i eit slikt prosjekt. Ikkje ein gong Språkbanken, som er ei nasjonal korpussamling administrert av Nasjonalbiblioteket, har eit stort nok parallellkorpus.
Nynorskroboten vart i staden basert på Apertium, og har no blitt veldig bra.
Men eg har lagt merke til at (den kommersielle, ikkje-frie tenesta) https://www.deepl.com/ – som etter mi erfaring ofte gjev betre og meir naturlege omsettingar enn Google Translate (for dei språka som er støtta) – faktisk støttar omsetjing til/frå svensk. Det indikerer jo at tilsvarande støtte for norsk også *burde* vera mogleg.