線上擷取影片畫面文字
用 OCR 逐幀辨識影片畫面裡的文字——硬字幕、標題、彈幕、簡報畫面文字,自動產生帶時間軸的文字,一鍵匯出 TXT、SRT,全程瀏覽器本機處理
OCR 辨識畫面文字
逐幀「看」影片畫面辨識燒錄的文字,硬字幕、標題、彈幕、浮水印文字都能擷取,與靠聽聲音的語音辨識互補
可選區域 + 自訂間隔
可只辨識底部字幕區提升準確率,取樣間隔靈活可調,兼顧速度與完整度,辨識結果自動去重合併
本地處理保護隱私
畫面解碼與文字辨識均在瀏覽器本機完成,影片不上傳任何伺服器,隱私內容也能放心處理
拖曳影片檔案到此處
或
支援 MP4、WebM、MOV、MKV、AVI 等格式
擷取影片畫面文字的使用情境
內容整理與學習
- 把線上課程、講座錄影裡 PPT/板書上的文字擷取出來,整理成筆記方便檢索
- 擷取帶硬字幕(字幕燒錄在畫面上)影片的文字,做成文稿或學習材料
- 擷取教學示範影片中畫面上出現的程式碼、指令和步驟文字
創作與辦公
- 擷取短影片裡的標題、彈幕、貼紙文字,用於二次創作和分析
- 把只有硬字幕、沒有獨立字幕檔的影片還原成可編輯的 SRT
- 從產品示範、發表會錄影中擷取簡報上的關鍵資訊和數據
使用步驟
上傳影片
點擊上傳區域或拖曳影片檔案,支援 MP4、MKV、WebM、MOV 等格式
選擇語言與辨識區域
選擇畫面文字的語言,依需求選擇整個畫面或僅辨識底部字幕區
開始辨識
點擊「開始辨識文字」,OCR 在本機逐幀辨識畫面文字
預覽並匯出
預覽辨識結果,下載 TXT/SRT 或一鍵複製純文字
關於擷取影片畫面文字工具
VideoKit 擷取影片畫面文字工具基於 WebCodecs 與本機 OCR 光學字元辨識技術,先把影片逐幀解碼成圖片,再辨識每一幀畫面上出現的文字,自動去重合併成帶時間軸的文字。
它專門用於辨識「燒錄在畫面上」的文字,例如硬字幕、標題、彈幕、浮水印和簡報畫面裡的字。如果你想要的是根據聲音轉寫出的字幕,請使用「擷取影片字幕」(語音辨識)工具。
所有處理均在本機瀏覽器完成,影片和辨識出的文字不會離開你的裝置。建議使用 Chrome 或 Edge 瀏覽器;OCR 效果與畫面文字的清晰度、字級和對比度相關,匯出後建議再簡單校對。
常見問題
這個工具和「擷取影片字幕」有什麼差別?
本工具使用 OCR 光學字元辨識,逐幀「看」影片畫面,辨識燒錄在畫面上的文字,例如硬字幕、標題、彈幕、浮水印文字、PPT/簡報畫面裡的字。而「擷取影片字幕」工具用的是語音辨識(ASR),根據聲音「聽寫」出說了什麼。簡單說:畫面上有字用本工具,靠聽聲音用字幕工具。
它是怎麼辨識畫面文字的?
工具會依你設定的取樣間隔把影片逐幀擷取成圖片,再用瀏覽器本機的 OCR 引擎辨識每一幀裡的文字,最後自動去重、合併成帶時間軸的文字段落。整個過程都在你的瀏覽器裡完成,影片不會上傳。
支援哪些語言的文字?
支援中文(簡體/繁體)、英語、日語、韓語、法語、德語、西班牙語、葡萄牙語、義大利語、俄語、阿拉伯語、印地語、越南語、土耳其語、印尼語等。辨識前請選擇畫面文字對應的語言;中英混排可選擇「中文 + English」組合以獲得更好效果。
取樣間隔和辨識區域怎麼選?
取樣間隔越小辨識越完整,但逐幀 OCR 較慢,長影片建議先用 2~5 秒間隔試跑。如果文字集中在畫面底部(典型硬字幕),把辨識區域設為「僅底部字幕區」可以過濾畫面其他干擾、加快速度並提升準確率;否則用「整個畫面」。
影片檔案會被上傳到伺服器嗎?
不會。影片解碼、逐幀擷圖和 OCR 文字辨識全部在你的瀏覽器本機完成,影片檔案不會上傳到任何伺服器。辨識引擎首次使用時會從 CDN 下載並快取到瀏覽器,之後可離線重複使用。
辨識結果不準確怎麼辦?
OCR 效果取決於畫面文字的清晰度、字級和對比度。如果結果不理想,可嘗試:確認選對了語言、把取樣間隔調小、對底部字幕使用「僅底部字幕區」、或先用我們的其他工具把影片調清晰。辨識結果匯出後建議再簡單校對一遍。