Question 1

このツールはどのように字幕を抽出しますか？

Accepted Answer

本ツールはAI音声認識（ASR）技術を使い、動画内の音声を自動で認識してタイムコード付きの字幕テキストに変換します。動画に既存の字幕トラックを読み取るのではなく、音声を「聞き取って」字幕を生成するため、動画に字幕がまったく含まれていなくてもテキストを抽出できます。認識と書き起こしはすべてブラウザ内でローカルに行われます。

Question 2

どの字幕形式で書き出せますか？

Accepted Answer

3種類の形式に対応しています。SRT（最も汎用的な字幕形式で、通し番号とタイムコード付き）、VTT（HTML5動画向けのWeb標準字幕）、TXT（タイムコードのないプレーンテキストの原稿で、議事録やコンテンツ原稿に最適）です。認識完了後は自由にダウンロードでき、プレーンテキストをワンクリックでコピーすることもできます。

Question 3

どの言語の動画に対応していますか？

Accepted Answer

中国語（簡体字／繁体字）、英語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語、ロシア語、アラビア語、ヒンディー語、インドネシア語、ベトナム語、トルコ語など、さまざまな言語に対応しています。より正確な認識結果を得るため、抽出前に動画で話されている言語を選択してください。

Question 4

動画ファイルはサーバーにアップロードされますか？

Accepted Answer

アップロードされません。音声抽出、AIモデルの推論、字幕生成はすべてお使いのブラウザ内でローカルに行われ、動画ファイルがサーバーへアップロードされることはありません。動画と認識されたテキストは完全にあなた自身の管理下にあるため、プライバシーに関わる内容も安心して処理できます。

Question 5

認識速度と精度はどう選べばよいですか？

Accepted Answer

本ツールは複数の認識レベルを用意しています。速度を重視する場合は「最速」または「高速」を選ぶと、短い動画のクイックプレビューに適しています。精度を重視する場合は「高精度」または「最高精度」を選べます（最高精度のレベルにはブラウザのWebGPU対応が必要です）。長尺、中国語、なまりや背景ノイズのある動画には、より高精度のレベルをおすすめします。あるレベルを初めて使用する際は、対応するAIモデルがブラウザのキャッシュにダウンロードされます。

Question 6

抽出した字幕はそのまま動画に使えますか？

Accepted Answer

使えます。書き出したSRT/VTT字幕ファイルには標準のタイムコードが付いており、VLCやPotPlayerなどのプレーヤーで外部字幕としてそのまま読み込めます。また、当サイトの「動画に字幕を追加」ツールを使えば、字幕を動画に埋め込んでソフト字幕として生成することもできます。AI認識には多少の誤りが生じる場合があるため、書き出し後に一度簡単に校正することをおすすめします。

オンラインで動画から字幕を抽出

AIによる自動認識

多言語 + 多形式

ローカル処理でプライバシーを保護

動画から字幕を抽出する活用シーン

コンテンツ制作とオフィス業務

学習とアクセシビリティ

利用手順

動画字幕抽出ツールについて

よくある質問