Question 1

这个工具和「提取视频字幕」有什么区别？

Accepted Answer

本工具用 OCR 光学字符识别，逐帧「看」视频画面，识别烧录在画面上的文字，比如硬字幕、标题、弹幕、水印文字、PPT/演示画面里的字。而「提取视频字幕」工具用的是语音识别（ASR），根据声音「听写」出说了什么。简单说：画面上有字用本工具，靠听声音用字幕工具。

Question 2

它是怎么识别画面文字的？

Accepted Answer

工具会按你设置的采样间隔把视频逐帧截取成图片，再用浏览器本地的 OCR 引擎识别每一帧里的文字，最后自动去重、合并成带时间轴的文字段落。整个过程在你的浏览器里完成，视频不会上传。

Question 3

支持哪些语言的文字？

Accepted Answer

支持中文（简体/繁体）、英语、日语、韩语、法语、德语、西班牙语、葡萄牙语、意大利语、俄语、阿拉伯语、印地语、越南语、土耳其语、印尼语等。识别前请选择画面文字对应的语言；中英混排可选择「中文 + English」组合以获得更好效果。

Question 4

采样间隔和识别区域怎么选？

Accepted Answer

采样间隔越小识别越完整，但逐帧 OCR 较慢，长视频建议先用 2~5 秒间隔试跑。如果文字集中在画面底部（典型硬字幕），把识别区域设为「仅底部字幕区」可以过滤画面其他干扰、加快速度并提升准确率；否则用「整个画面」。

Question 5

视频文件会被上传到服务器吗？

Accepted Answer

不会。视频解码、逐帧截图和 OCR 文字识别全部在你的浏览器本地完成，视频文件不会上传到任何服务器。识别引擎首次使用时会从 CDN 下载并缓存到浏览器，之后可离线复用。

Question 6

识别结果不准确怎么办？

Accepted Answer

OCR 效果取决于画面文字的清晰度、字号和对比度。如果结果不理想，可尝试：确认选对了语言、把采样间隔调小、对底部字幕使用「仅底部字幕区」、或先用我们的其他工具把视频调清晰。识别结果导出后建议再简单校对一遍。

在线提取视频画面文字

提取视频画面文字的使用场景