Question 1

Quelle différence avec « Extraire les sous-titres d'une vidéo » ?

Accepted Answer

Cet outil utilise l'OCR (reconnaissance optique de caractères) pour « regarder » la vidéo image par image et reconnaître le texte incrusté dans l'image, comme les sous-titres incrustés, les titres, les danmaku, le texte des filigranes et les mots des écrans PPT/présentations. L'outil « Extraire les sous-titres d'une vidéo » utilise quant à lui la reconnaissance vocale (ASR) pour « transcrire » ce qui est dit. En bref : utilisez cet outil pour le texte à l'écran, et l'outil de sous-titres pour l'audio parlé.

Question 2

Comment reconnaît-il le texte à l'écran ?

Accepted Answer

Selon l'intervalle d'échantillonnage que vous définissez, l'outil capture la vidéo image par image sous forme d'images, puis utilise un moteur OCR local dans le navigateur pour reconnaître le texte de chaque image, et enfin élimine les doublons et les fusionne en segments de texte avec chronologie. Tout le processus s'exécute dans votre navigateur et la vidéo n'est jamais envoyée.

Question 3

Quelles langues de texte sont prises en charge ?

Accepted Answer

Prend en charge le chinois (simplifié/traditionnel), l'anglais, le japonais, le coréen, le français, l'allemand, l'espagnol, le portugais, l'italien, le russe, l'arabe, le hindi, le vietnamien, le turc, l'indonésien et plus encore. Avant la reconnaissance, choisissez la langue correspondant au texte à l'écran ; pour un mélange de chinois et d'anglais, choisissez l'option « Chinois + English » pour de meilleurs résultats.

Question 4

Comment choisir l'intervalle d'échantillonnage et la zone de reconnaissance ?

Accepted Answer

Un intervalle plus petit donne des résultats plus complets, mais l'OCR image par image est plus lent ; pour les vidéos longues, essayez d'abord un intervalle de 2 à 5 secondes. Si le texte se concentre en bas de l'image (sous-titres incrustés typiques), régler la zone de reconnaissance sur « Zone de sous-titres inférieure uniquement » filtre les autres distractions, accélère le traitement et améliore la précision ; sinon, utilisez « Toute l'image ».

Question 5

Mes fichiers vidéo sont-ils envoyés sur un serveur ?

Accepted Answer

Non. Le décodage de la vidéo, la capture des images et la reconnaissance OCR s'exécutent localement dans votre navigateur ; le fichier vidéo n'est jamais envoyé à aucun serveur. Le moteur de reconnaissance est téléchargé depuis un CDN et mis en cache dans votre navigateur à la première utilisation, puis réutilisable hors ligne.

Question 6

Que faire si les résultats ne sont pas précis ?

Accepted Answer

La précision de l'OCR dépend de la netteté, de la taille et du contraste du texte à l'écran. Si les résultats ne sont pas idéaux, essayez : de confirmer la bonne langue, d'utiliser un intervalle d'échantillonnage plus petit, d'utiliser « Zone de sous-titres inférieure uniquement » pour les sous-titres en bas, ou d'abord de rendre la vidéo plus nette avec nos autres outils. Il est conseillé de relire les résultats exportés.

Extraire le texte à l'écran d'une vidéo en ligne

Reconnaissance OCR du texte à l'écran

Zone sélectionnable + intervalle personnalisé

Traitement local pour protéger votre vie privée

Cas d'usage de l'extraction de texte à l'écran de vidéo

Organisation de contenu et apprentissage

Création et bureautique

Étapes d'utilisation

À propos de l'outil d'extraction de texte à l'écran de vidéo

Questions fréquentes