Extraire le texte à l'écran d'une vidéo en ligne

Utilisez l'OCR pour reconnaître le texte des images de la vidéo (sous-titres incrustés, titres, danmaku, texte de présentation), générant automatiquement du texte avec chronologie et exportant en TXT et SRT en un clic, le tout traité localement dans votre navigateur

Reconnaissance OCR du texte à l'écran

Lit la vidéo image par image pour reconnaître le texte incrusté (sous-titres incrustés, titres, danmaku et texte des filigranes), en complément de la reconnaissance vocale basée sur l'audio

Zone sélectionnable + intervalle personnalisé

Reconnaissez uniquement la zone de sous-titres inférieure pour plus de précision, avec un intervalle d'échantillonnage flexible qui équilibre vitesse et exhaustivité ; les résultats sont dédupliqués et fusionnés automatiquement

Traitement local pour protéger votre vie privée

Le décodage des images et la reconnaissance du texte s'exécutent localement dans votre navigateur ; les vidéos ne sont jamais envoyées à aucun serveur, même le contenu privé reste donc protégé

Glissez-déposez vos fichiers vidéo ici

ou

Prend en charge les formats MP4, WebM, MOV, MKV, AVI

Cas d'usage de l'extraction de texte à l'écran de vidéo

Organisation de contenu et apprentissage

  • Extrayez le texte des PPT/tableaux dans les enregistrements de cours et de conférences et organisez-le en notes faciles à rechercher
  • Extrayez le texte des vidéos à sous-titres incrustés (sous-titres gravés dans l'image) pour créer des transcriptions ou du matériel d'étude
  • Extrayez le code, les commandes et le texte des étapes affichés à l'écran dans les tutoriels et vidéos de démonstration

Création et bureautique

  • Extrayez les titres, danmaku et texte des autocollants des vidéos courtes pour les réutiliser et les analyser
  • Récupérez un SRT modifiable à partir de vidéos qui n'ont que des sous-titres incrustés et aucun fichier de sous-titres séparé
  • Extrayez les informations et données clés des diapositives dans les enregistrements de démonstrations produit et de lancements

Étapes d'utilisation

1

Téléverser la vidéo

Cliquez sur la zone d'import ou faites glisser le fichier vidéo. Compatible MP4, MKV, WebM, MOV et plus.

2

Choisir la langue et la zone de reconnaissance

Choisissez la langue du texte à l'écran, et sélectionnez toute l'image ou uniquement la zone de sous-titres inférieure selon vos besoins

3

Démarrer la reconnaissance

Cliquez sur « Démarrer la reconnaissance de texte » et l'OCR reconnaît le texte à l'écran image par image localement

4

Prévisualiser et exporter

Prévisualisez les résultats, téléchargez le TXT/SRT ou copiez le texte brut en un clic

À propos de l'outil d'extraction de texte à l'écran de vidéo

L'outil d'extraction de texte à l'écran de VideoKit repose sur WebCodecs et l'OCR local (reconnaissance optique de caractères) : il décode d'abord la vidéo image par image en images, puis reconnaît le texte apparaissant dans chaque image et le fusionne automatiquement sans doublons en texte avec chronologie.

Il est conçu pour reconnaître le texte « incrusté dans l'image », comme les sous-titres incrustés, les titres, les danmaku, les filigranes et le texte des écrans de présentation. Si vous voulez des sous-titres transcrits depuis l'audio, utilisez l'outil « Extraire les sous-titres d'une vidéo » (reconnaissance vocale).

Tout le traitement s'exécute localement dans votre navigateur ; la vidéo et le texte reconnu ne quittent jamais votre appareil. Chrome ou Edge est recommandé ; la qualité de l'OCR dépend de la netteté, de la taille et du contraste du texte à l'écran, il est donc conseillé de relire après l'export.

Questions fréquentes

Quelle différence avec « Extraire les sous-titres d'une vidéo » ?

Cet outil utilise l'OCR (reconnaissance optique de caractères) pour « regarder » la vidéo image par image et reconnaître le texte incrusté dans l'image, comme les sous-titres incrustés, les titres, les danmaku, le texte des filigranes et les mots des écrans PPT/présentations. L'outil « Extraire les sous-titres d'une vidéo » utilise quant à lui la reconnaissance vocale (ASR) pour « transcrire » ce qui est dit. En bref : utilisez cet outil pour le texte à l'écran, et l'outil de sous-titres pour l'audio parlé.

Comment reconnaît-il le texte à l'écran ?

Selon l'intervalle d'échantillonnage que vous définissez, l'outil capture la vidéo image par image sous forme d'images, puis utilise un moteur OCR local dans le navigateur pour reconnaître le texte de chaque image, et enfin élimine les doublons et les fusionne en segments de texte avec chronologie. Tout le processus s'exécute dans votre navigateur et la vidéo n'est jamais envoyée.

Quelles langues de texte sont prises en charge ?

Prend en charge le chinois (simplifié/traditionnel), l'anglais, le japonais, le coréen, le français, l'allemand, l'espagnol, le portugais, l'italien, le russe, l'arabe, le hindi, le vietnamien, le turc, l'indonésien et plus encore. Avant la reconnaissance, choisissez la langue correspondant au texte à l'écran ; pour un mélange de chinois et d'anglais, choisissez l'option « Chinois + English » pour de meilleurs résultats.

Comment choisir l'intervalle d'échantillonnage et la zone de reconnaissance ?

Un intervalle plus petit donne des résultats plus complets, mais l'OCR image par image est plus lent ; pour les vidéos longues, essayez d'abord un intervalle de 2 à 5 secondes. Si le texte se concentre en bas de l'image (sous-titres incrustés typiques), régler la zone de reconnaissance sur « Zone de sous-titres inférieure uniquement » filtre les autres distractions, accélère le traitement et améliore la précision ; sinon, utilisez « Toute l'image ».

Mes fichiers vidéo sont-ils envoyés sur un serveur ?

Non. Le décodage de la vidéo, la capture des images et la reconnaissance OCR s'exécutent localement dans votre navigateur ; le fichier vidéo n'est jamais envoyé à aucun serveur. Le moteur de reconnaissance est téléchargé depuis un CDN et mis en cache dans votre navigateur à la première utilisation, puis réutilisable hors ligne.

Que faire si les résultats ne sont pas précis ?

La précision de l'OCR dépend de la netteté, de la taille et du contraste du texte à l'écran. Si les résultats ne sont pas idéaux, essayez : de confirmer la bonne langue, d'utiliser un intervalle d'échantillonnage plus petit, d'utiliser « Zone de sous-titres inférieure uniquement » pour les sous-titres en bas, ou d'abord de rendre la vidéo plus nette avec nos autres outils. Il est conseillé de relire les résultats exportés.