Jeg oppdaget nettopp en oppskrift for å kombinere ffmpeg med whisper.cpp
for automatick transkribering av video til undertekstfiler i
.srt-formatet,
<URL: https://medium.com/@vpalmisano/run-whisper-audio-transcriptions-with-one-ff… >.
Jeg testet oppskriften med ffmpeg-utgaven for Debian lastet ned fra
<URL: https://salsa.debian.org/multimedia-team/ffmpeg > og bygde uten
problemer .deb-pakker med whisper-støtte ved å bruke endringen
dokumentert på <URL: https://bugs.debian.org/1128084 >.
Resultatet fungerte over all forventning. Kunne laste ned et
NUUG-foredrag og så hente ut talen som output.srt:
yt-dlp 'https://youtu.be/watch?v=TxKa2K73JFw'
ffmpeg -i NUUG-foredrag:\ Sikker\ sletting\,\ kryptering\ og\ bedre\ utnyttelse\ av\ datalager\ med\ komprimering\ \[TxKa2K73JFw\].mkv -vn -af "whisper=model=$HOME/models-whisper/ggml-model-q5_0.bin\
:language=en\
:queue=3\
:destination=output.srt\
:format=srt" -f null -
Jeg har ikke studert sluttresultatet spesielt nøye, men ser at det er
dukket opp tekst der i hvert fall fragmenter stemmer over ens med det
jeg husker fra møtet.
Tenkte kanskje flere i videogruppen kunne finne dette interessant.
--
Happy hacking
Petter Reinholdtsen