Question 1

このツールと「動画字幕の抽出」の違いは？

Accepted Answer

本ツールはOCR（光学文字認識）で動画をフレームごとに「見て」、画面に焼き込まれた文字（焼き込み字幕、タイトル、弾幕、ウォーターマーク文字、PPT/プレゼン画面の文字など）を認識します。一方「動画字幕の抽出」ツールは音声認識（ASR）で話された内容を「書き起こし」ます。つまり、画面上の文字には本ツール、音声には字幕ツールを使います。

Question 2

画面内テキストはどのように認識しますか？

Accepted Answer

設定したサンプリング間隔で動画をフレームごとに画像として取り込み、ブラウザ内のOCRエンジンで各フレームの文字を認識し、最後に重複を除去してタイムライン付きの文章にまとめます。すべてブラウザ内で処理され、動画はアップロードされません。

Question 3

対応している文字の言語は？

Accepted Answer

中国語（簡体字/繁体字）、英語、日本語、韓国語、フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語、ロシア語、アラビア語、ヒンディー語、ベトナム語、トルコ語、インドネシア語などに対応。認識前に画面文字に合った言語を選択してください。日中混在の場合は「中国語 + English」の組み合わせを選ぶとより良い結果になります。

Question 4

サンプリング間隔と認識範囲の選び方は？

Accepted Answer

間隔が小さいほど認識は完全になりますが、フレームごとのOCRは遅くなります。長い動画はまず2〜5秒間隔で試すのがおすすめです。文字が画面下部に集中している場合（典型的な焼き込み字幕）、認識範囲を「下部字幕エリアのみ」にすると、他の部分の干渉を除いて高速化・精度向上できます。それ以外は「画面全体」を使います。

Question 5

動画ファイルはサーバーにアップロードされますか？

Accepted Answer

いいえ。動画のデコード、フレーム取り込み、OCR文字認識はすべてブラウザ内で処理され、動画ファイルはどのサーバーにもアップロードされません。認識エンジンは初回利用時にCDNからダウンロードされブラウザにキャッシュされ、以降はオフラインで再利用できます。

Question 6

認識結果が正確でない場合は？

Accepted Answer

OCRの精度は画面文字の鮮明さ・サイズ・コントラストに左右されます。結果が思わしくない場合は、正しい言語を選ぶ、サンプリング間隔を小さくする、下部字幕には「下部字幕エリアのみ」を使う、または他のツールで先に動画を鮮明にする、などをお試しください。書き出し後は校正することをおすすめします。

動画の画面内テキストをオンライン抽出

OCRで画面文字を認識

範囲選択 + 間隔カスタマイズ

ローカル処理でプライバシーを保護

動画の画面内テキスト抽出の活用シーン

コンテンツ整理と学習

制作とビジネス

利用手順

動画画面内テキスト抽出ツールについて

よくある質問