Question 1

¿En qué se diferencia de «Extraer subtítulos de vídeo»?

Accepted Answer

Esta herramienta usa OCR (reconocimiento óptico de caracteres) para «mirar» el vídeo fotograma a fotograma y reconocer el texto incrustado en la imagen, como subtítulos incrustados, títulos, danmaku, texto de marcas de agua y palabras en pantallas de PPT/presentaciones. En cambio, «Extraer subtítulos de vídeo» usa reconocimiento de voz (ASR) para «transcribir» lo que se dice. En resumen: usa esta herramienta para el texto en pantalla y la de subtítulos para el audio hablado.

Question 2

¿Cómo reconoce el texto en pantalla?

Accepted Answer

Según el intervalo de muestreo que definas, la herramienta captura el vídeo fotograma a fotograma en imágenes, luego usa un motor OCR local en el navegador para reconocer el texto de cada fotograma y, por último, elimina duplicados y los fusiona en segmentos de texto con línea de tiempo. Todo el proceso se ejecuta en tu navegador y el vídeo nunca se sube.

Question 3

¿Qué idiomas de texto admite?

Accepted Answer

Admite chino (simplificado/tradicional), inglés, japonés, coreano, francés, alemán, español, portugués, italiano, ruso, árabe, hindi, vietnamita, turco, indonesio y más. Antes de reconocer, elige el idioma que coincida con el texto en pantalla; para mezcla de chino e inglés, elige la opción «Chino + English» para obtener mejores resultados.

Question 4

¿Cómo elijo el intervalo de muestreo y el área de reconocimiento?

Accepted Answer

Un intervalo menor da resultados más completos, pero el OCR fotograma a fotograma es más lento, así que en vídeos largos prueba primero con un intervalo de 2 a 5 segundos. Si el texto se concentra en la parte inferior de la imagen (subtítulos incrustados típicos), configurar el área de reconocimiento en «Solo área de subtítulos inferior» filtra otras distracciones, acelera el proceso y mejora la precisión; de lo contrario, usa «Toda la imagen».

Question 5

¿Se suben los archivos a un servidor?

Accepted Answer

No. La decodificación del vídeo, la captura de fotogramas y el reconocimiento OCR se ejecutan localmente en tu navegador; el archivo de vídeo nunca se sube a ningún servidor. El motor de reconocimiento se descarga desde una CDN y se almacena en caché en tu navegador la primera vez, y luego se puede reutilizar sin conexión.

Question 6

¿Qué hago si los resultados no son precisos?

Accepted Answer

La precisión del OCR depende de la nitidez, el tamaño y el contraste del texto en pantalla. Si los resultados no son ideales, prueba: confirmar el idioma correcto, usar un intervalo de muestreo menor, usar «Solo área de subtítulos inferior» para los subtítulos inferiores, o primero mejorar la nitidez del vídeo con nuestras otras herramientas. Conviene revisar los resultados exportados.

Extraer texto en pantalla de vídeo online

Reconocimiento OCR del texto en pantalla

Área seleccionable + intervalo personalizado

Procesamiento local que protege tu privacidad

Casos de uso para extraer texto en pantalla de vídeo

Organización de contenido y estudio

Creación y oficina

Pasos para usarlo

Acerca de la herramienta de extracción de texto en pantalla de vídeo

Preguntas frecuentes