線上擷取影片字幕
AI 語音辨識自動將影片中的語音轉成帶時間軸的文字,一鍵匯出 SRT、VTT、TXT,全程瀏覽器本機處理
AI 自動辨識
以語音辨識模型自動「聽寫」影片對話,無需手動逐句輸入,幾分鐘即可得到完整逐字稿與時間軸
多語言 + 多格式
支援中英日韓等十餘種語言,可匯出 SRT、VTT 字幕與 TXT 純文稿,滿足字幕、記錄、翻譯等多種用途
本地處理保護隱私
音訊擷取、模型推論與文字產生皆在瀏覽器本機完成,影片不上傳任何伺服器,隱私內容也能放心處理
拖曳影片檔案到此處
或
支援 MP4、WebM、MOV、MKV、AVI 等格式
擷取影片字幕的使用情境
內容創作與辦公
- 把訪談、Podcast、會議錄影一鍵轉成逐字稿,快速整理紀要、提煉重點
- 為短影片、Vlog 自動產生字幕檔,校對後直接發布,提升完播率
- 將影片內容轉成逐字稿,用於二次創作、改寫成圖文或社群文章
學習與無障礙
- 擷取外語影片字幕作為聽力素材,搭配精聽練習,逐句對照原文學習
- 把線上課程、講座錄影轉成文字,方便搜尋關鍵字、做筆記與複習
- 為影片產生字幕以提升無障礙存取性,協助聽障人士與靜音環境下的觀眾
使用步驟
上傳影片
點擊上傳區域或拖曳影片檔案,支援 MP4、MKV、WebM、MOV 等格式
選擇語言與辨識檔位
選擇影片中說話的語言,並依需求選擇辨識速度與準確率
開始擷取
點擊「開始擷取字幕」,AI 在本機完成音訊辨識與文字產生
預覽並匯出
預覽辨識結果,下載 SRT/VTT/TXT 或一鍵複製純文字
關於擷取影片字幕工具
VideoKit 線上擷取影片字幕工具以 WebCodecs 與本機 AI 語音辨識技術為基礎,先從影片中擷取音訊,再用語音辨識模型「聽寫」出帶時間軸的文字字幕,整個過程無需上傳伺服器。
與「讀取既有字幕軌道」不同,本工具是依據音訊內容自動產生字幕,因此即使影片本身沒有字幕也能擷取出文字。辨識結果可匯出為 SRT、VTT 字幕或 TXT 純文稿。
所有處理皆在本機瀏覽器完成,影片與辨識出的文字不會離開您的裝置。建議使用 Chrome 或 Edge 瀏覽器以獲得最佳效能,長影片建議選擇更高準確率的辨識檔位。
常見問題
這個工具是如何擷取字幕的?
本工具採用 AI 語音辨識(ASR)技術,自動辨識影片中的語音內容並轉換成帶時間軸的文字字幕。它不是從影片裡讀取既有的字幕軌道,而是依據音訊「聽寫」產生字幕,因此即使影片本身沒有任何字幕,也能擷取出文字。辨識與轉寫全部在瀏覽器本機完成。
支援匯出哪些字幕格式?
支援三種格式:SRT(最通用的字幕格式,帶序號與時間軸)、VTT(Web 標準字幕,用於 HTML5 影片)、TXT(純文字逐字稿,沒有時間軸,適合做會議記錄、內容稿)。辨識完成後可任意下載,也可以一鍵複製純文字。
支援哪些語言的影片?
支援中文(簡體/繁體)、英語、日語、韓語、西班牙語、法語、德語、葡萄牙語、義大利語、俄語、阿拉伯語、印地語、印尼語、越南語、土耳其語等多種語言。擷取前請選擇影片中說話的語言,以獲得更精準的辨識效果。
影片檔案會被上傳到伺服器嗎?
不會。音訊擷取、AI 模型推論與字幕產生全部在您的瀏覽器本機完成,影片檔案不會上傳到任何伺服器。您的影片與辨識出的文字內容完全由您自己掌控,可放心處理隱私內容。
辨識速度與準確率該怎麼選?
工具提供多個辨識檔位:追求速度可選「最快」或「很快」,適合短影片快速預覽;追求準確率可選「更準」或「最準」(最準檔位需要瀏覽器支援 WebGPU)。長影片、中文、有口音或背景雜訊的影片建議選更高準確率的檔位。首次使用某檔位時會下載對應的 AI 模型到瀏覽器快取。
擷取出的字幕可以直接用於影片嗎?
可以。匯出的 SRT/VTT 字幕檔帶有標準時間軸,可直接在 VLC、PotPlayer 等播放器中作為外掛字幕載入,也可以用我們的「影片加字幕」工具把它嵌入影片產生軟字幕。AI 辨識可能存在少量錯誤,建議匯出後簡單校對一遍。