Question 1

这个工具是如何提取字幕的？

Accepted Answer

本工具使用 AI 语音识别（ASR）技术，自动识别视频中的语音内容并转换成带时间轴的文字字幕。它不是从视频里读取已有的字幕轨道，而是根据音频「听写」生成字幕，因此即使视频本身没有任何字幕，也能提取出文字。识别和转写全部在浏览器本地完成。

Question 2

支持导出哪些字幕格式？

Accepted Answer

支持三种格式：SRT（最通用的字幕格式，带序号和时间轴）、VTT（Web 标准字幕，用于 HTML5 视频）、TXT（纯文本文稿，没有时间轴，适合做会议记录、内容稿）。识别完成后可任意下载，也可以一键复制纯文本。

Question 3

支持哪些语言的视频？

Accepted Answer

支持中文（简体/繁体）、英语、日语、韩语、西班牙语、法语、德语、葡萄牙语、意大利语、俄语、阿拉伯语、印地语、印尼语、越南语、土耳其语等多种语言。提取前请选择视频中说话的语言，以获得更准确的识别效果。

Question 4

视频文件会被上传到服务器吗？

Accepted Answer

不会。音频提取、AI 模型推理和字幕生成全部在您的浏览器本地完成，视频文件不会上传到任何服务器。您的视频和识别出的文字内容完全由您自己掌控，可放心处理隐私内容。

Question 5

识别速度和准确率怎么选？

Accepted Answer

工具提供多个识别档位：追求速度可选「最快」或「很快」，适合短视频快速预览；追求准确率可选「更准」或「最准」（最准档位需要浏览器支持 WebGPU）。长视频、中文、有口音或背景噪声的视频建议选更高准确率的档位。首次使用某档位时会下载对应的 AI 模型到浏览器缓存。

Question 6

提取出的字幕可以直接用于视频吗？

Accepted Answer

可以。导出的 SRT/VTT 字幕文件带有标准时间轴，可直接在 VLC、PotPlayer 等播放器中作为外挂字幕加载，也可以用我们的「视频添加字幕」工具把它嵌入视频生成软字幕。AI 识别可能存在少量错误，建议导出后简单校对一遍。

在线提取视频字幕

提取视频字幕的使用场景