之前我們曾介紹過一款 MacWhisper 的語音轉字幕免費工具,這款僅支援 Mac 系統,而且需要搭配 OpenAI API 才能運作,不是完全免費,對於 Windows 用戶和預算有限的人可能不太適合,而這篇就要推薦另一個 WhisperDesktop 工具,支援 Windows 系統,而且是真的完全免費,語音轉字幕的速度不僅快,還支援翻譯功能,相當強大。
WhisperDesktop 完全免費的 AI 影片、語音轉字幕工具,還提供翻譯功能
WhisperDesktop 是一款開源工具,有在 GitHub 上分享,下載之後可直接打使用,無需安裝。首次打開可能會跳出這個訊息,點擊 “其他資訊”:
就會出現 “仍要執行” 的按鈕了:
操作介面雖然是英文,但使用上蠻簡單的,一開始需要先讀入模型檔才可以,模型檔可以到 Hugging Face 下載:
根據開發者說明,他推薦使用 ggml-medium.bin 這一個,你可以先試試看電腦跑不跑得動,基本上電腦硬體規格沒有太入門的應該都可以:
進到下一頁後,要再點擊 download 才會下載,模型檔還蠻大的,要 1.53GB,下載需要等一些時間:
下載完成之後,就把 ggml-medium.bin 這個模型檔讀進來,Model Implementation 保留 GPU 即可,然後按 OK:
會跳轉到這畫面,Language 部分選擇你要的字幕語言,我測試把中文影片轉成中文字幕,所以我選 “Chinese”:
把影片檔讀進來後,Output Format 部分選擇 SubRip subtitles:
設定字幕檔名以及儲存位置,按 Transcribe 就會開始轉換:
我測試的這部影片是 5 分多鐘,只花 38 秒就完成轉換,速度真的超快:
精準度真的高,不僅時間戳都正確,我快速掃下來看起來都沒有辨識錯誤,連中文 + 英文也都精準辨識。所以說,對於有在製作影片的人,有這工具之後,上字幕就簡單了!也不用再使用其他付費版的工具:
再來我測試英文字幕也行,翻譯品質也還不錯:
檔案格式部分,我測試 MP4、MP3 格式都可以,對於需要將開會、演講錄音轉成字幕的朋友,也可以用這工具來實現。比較可惜是目前還沒有 Mac 版本,Mac 用戶想用的話,就必須透過虛擬機來實現。想摸索的人,也可以試試看其他 Whisper 模型的辨識精準度和速度。