Kjekt! Takk for introen, eg testa ut whisper òg.
On Thu, 12 Jan 2023 at 23:38, Håkon Løvdal hlovdal@gmail.com wrote:
Dette gikk derimot ganske bra, om ikke akkurat lynkjapt:
Fyrste gong du køyrer han so lastar han jo ned modellen i frå internett. So det vil jo bli teke med i rekneskapen her. Køyr kommandoen ein gong til so går det kjappare. For min del tok det 2m41s fyrste gong (med nedlasting), andre køyring tok 18s. Som likevel var overraskande treigt sjølv for medium modellen. Eg skal jo ha eit bra skjermkort (RTX 4050, det billigaste, men heilt nytt).
Eg prøvde òg svensk, men då med modellen "small", som er kjappare og mindre, men òg mindre korrekt. Den er absolutt mindre korrekt som du kan sjå:
(whisper) odin@enn:~/tmp/whisper$ time whisper --model small --language sv swedish.wav /home/odin/tmp/whisper/lib/python3.10/site-packages/whisper/transcribe.py:78: UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") [00:00.000 --> 00:03.520] Hej det här Linnus Turvalls och jag uttalar Linnux.
real 0m6,094s user 0m46,361s sys 0m4,083s
Men 6 sekund i staden for 18 sekund.
Whisper var forresten kjapt å setja opp når eg allereie hadde CUDA og slik installert:
mkdir whisper cd whisper/ python3 -mvenv . . bin/activate pip install git+https://github.com/openai/whisper.git wget https://mirrors.edge.kernel.org/pub/linux/kernel/SillySounds/english.wav wget https://mirrors.edge.kernel.org/pub/linux/kernel/SillySounds/swedish.wav time whisper --model tiny --language sv swedish.wav
Den siste der, "tiny" var enno kjappare på 1.7s. Og får med seg at Linux vert sagt to gongar, men med andre feil: [00:00.000 --> 00:03.500] Hej, det här är Linne Sturwald och jag uttalar Linneux Linneux.