一直以來阿達都有在拍影片,上字幕可說是後製最麻煩的一件事,不難,但非常花時間,要一直反覆聽然後確認位置,相信有在剪影片的人都有這感受。先前我曾介紹過一個可自動把影片語音轉成 SRT 字幕的中國服務,雖然已經很不錯用了,但還是有不少限制,像是最大檔只能 2GB、檔案必須上傳、需手動轉繁體等等。而這次要推薦的 Web Speech to Text 更加好用,檔案不用上傳,直接在瀏覽器完成語音辨識轉 SRT 字幕的工作,也支援讀取線上影片網址,更重要是,它支援繁體中文字幕,光這點就能省下很多時間,完全免費,下面也快速介紹給大家。
Web Speech to Text 使用介紹
Web Speech to Text 的使用方式非常簡單,點我進入該網頁後,會要求取得麥克風的權限,記得選擇 “允許“。這也代表說,它的工作流程是影片聲音從喇叭發出後,透過麥克風接收,然後再進行辨識,因此喇叭一定要開聲音,且不能太小聲,要不然會接收不到。
不過,Windows 系統還有另一個更好的選擇,就是上方寫的 “安裝並啟用 Virtual Audio Cable”,這套可以讓電腦聲音直接輸出到麥克風,這樣不僅不用擔心喇叭太大聲吵到別人,也能大幅提升聲音的辨識品質。Mac 部分這套似乎沒有支援,可以試試其他套:
如果你過去都沒裝過 Virtual Audio Cable,安裝過程就一直按下一步即可:
而未來要辨識語音時,把右下方聲音輸出改成 Virtual Audio Cable,待辨識完再改回電腦喇叭:
讀取影片有兩種方式,第一是 “選擇本機檔案”(無需上傳,直接在瀏覽器完成,因此多大的檔案都行),第二則是 “讀取網址”:
支援大家最常用的 YouTube:
辨識語言目前支援三個,繁體中文、普通話與英文:
選擇好影片後,就可以按下開始辨識。過程中會即時把聲音轉換成文字,並記錄開始、結束的時間。唯一要注意的是無法中斷,必須全部跑完才會產生 SRT 字幕檔,關掉網頁所有內容都會消失,另外也建議使用尚未加入背景音樂的影片,辨識會更加準確:
完成之後就能把 SRT 字幕檔下載下來:
不過,這套的語音辨識也還有很大進步空間,常常會出現漏掉或是辨識錯誤的狀況,因此全部跑完一樣需要一句句對,但至少時間都標記好,又是繁體中文,可省下不少時間。
補充資料
Web Speech to Text 網址:https://pulipulichen.github.io/HTML5-Speech-to-Text/