Question 1

這個工具和「擷取影片字幕」有什麼差別？

Accepted Answer

本工具使用 OCR 光學字元辨識，逐幀「看」影片畫面，辨識燒錄在畫面上的文字，例如硬字幕、標題、彈幕、浮水印文字、PPT/簡報畫面裡的字。而「擷取影片字幕」工具用的是語音辨識（ASR），根據聲音「聽寫」出說了什麼。簡單說：畫面上有字用本工具，靠聽聲音用字幕工具。

Question 2

它是怎麼辨識畫面文字的？

Accepted Answer

工具會依你設定的取樣間隔把影片逐幀擷取成圖片，再用瀏覽器本機的 OCR 引擎辨識每一幀裡的文字，最後自動去重、合併成帶時間軸的文字段落。整個過程都在你的瀏覽器裡完成，影片不會上傳。

Question 3

支援哪些語言的文字？

Accepted Answer

支援中文（簡體/繁體）、英語、日語、韓語、法語、德語、西班牙語、葡萄牙語、義大利語、俄語、阿拉伯語、印地語、越南語、土耳其語、印尼語等。辨識前請選擇畫面文字對應的語言；中英混排可選擇「中文 + English」組合以獲得更好效果。

Question 4

取樣間隔和辨識區域怎麼選？

Accepted Answer

取樣間隔越小辨識越完整，但逐幀 OCR 較慢，長影片建議先用 2~5 秒間隔試跑。如果文字集中在畫面底部（典型硬字幕），把辨識區域設為「僅底部字幕區」可以過濾畫面其他干擾、加快速度並提升準確率；否則用「整個畫面」。

Question 5

影片檔案會被上傳到伺服器嗎？

Accepted Answer

不會。影片解碼、逐幀擷圖和 OCR 文字辨識全部在你的瀏覽器本機完成，影片檔案不會上傳到任何伺服器。辨識引擎首次使用時會從 CDN 下載並快取到瀏覽器，之後可離線重複使用。

Question 6

辨識結果不準確怎麼辦？

Accepted Answer

OCR 效果取決於畫面文字的清晰度、字級和對比度。如果結果不理想，可嘗試：確認選對了語言、把取樣間隔調小、對底部字幕使用「僅底部字幕區」、或先用我們的其他工具把影片調清晰。辨識結果匯出後建議再簡單校對一遍。

線上擷取影片畫面文字

擷取影片畫面文字的使用情境