Jeg oppdaget nettopp en oppskrift for å kombinere ffmpeg med whisper.cpp for automatick transkribering av video til undertekstfiler i .srt-formatet, <URL: https://medium.com/@vpalmisano/run-whisper-audio-transcriptions-with-one-ffm... >.
Jeg testet oppskriften med ffmpeg-utgaven for Debian lastet ned fra <URL: https://salsa.debian.org/multimedia-team/ffmpeg > og bygde uten problemer .deb-pakker med whisper-støtte ved å bruke endringen dokumentert på <URL: https://bugs.debian.org/1128084 >.
Resultatet fungerte over all forventning. Kunne laste ned et NUUG-foredrag og så hente ut talen som output.srt:
yt-dlp 'https://youtu.be/watch?v=TxKa2K73JFw' ffmpeg -i NUUG-foredrag:\ Sikker\ sletting,\ kryptering\ og\ bedre\ utnyttelse\ av\ datalager\ med\ komprimering\ [TxKa2K73JFw].mkv -vn -af "whisper=model=$HOME/models-whisper/ggml-model-q5_0.bin\ :language=en\ :queue=3\ :destination=output.srt\ :format=srt" -f null -
Jeg har ikke studert sluttresultatet spesielt nøye, men ser at det er dukket opp tekst der i hvert fall fragmenter stemmer over ens med det jeg husker fra møtet.
Tenkte kanskje flere i videogruppen kunne finne dette interessant.