Question 1

Qual a diferença para «Extrair legendas do vídeo»?

Accepted Answer

Esta ferramenta usa OCR (reconhecimento óptico de caracteres) para «olhar» o vídeo quadro a quadro e reconhecer o texto embutido na imagem, como legendas embutidas, títulos, danmaku, texto de marcas d'água e palavras em telas de PPT/apresentações. Já a ferramenta «Extrair legendas do vídeo» usa reconhecimento de fala (ASR) para «transcrever» o que é dito. Em resumo: use esta ferramenta para o texto na tela e a de legendas para o áudio falado.

Question 2

Como ele reconhece o texto na tela?

Accepted Answer

Com base no intervalo de amostragem que você definir, a ferramenta captura o vídeo quadro a quadro em imagens, depois usa um mecanismo OCR local no navegador para reconhecer o texto de cada quadro e, por fim, remove duplicatas e as combina em segmentos de texto com linha do tempo. Todo o processo é executado no seu navegador e o vídeo nunca é enviado.

Question 3

Quais idiomas de texto são suportados?

Accepted Answer

Suporta chinês (simplificado/tradicional), inglês, japonês, coreano, francês, alemão, espanhol, português, italiano, russo, árabe, hindi, vietnamita, turco, indonésio e mais. Antes de reconhecer, escolha o idioma correspondente ao texto na tela; para mistura de chinês e inglês, escolha a opção «Chinês + English» para obter melhores resultados.

Question 4

Como escolher o intervalo de amostragem e a área de reconhecimento?

Accepted Answer

Um intervalo menor gera resultados mais completos, mas o OCR quadro a quadro é mais lento, então em vídeos longos experimente primeiro um intervalo de 2 a 5 segundos. Se o texto se concentra na parte inferior da imagem (legendas embutidas típicas), definir a área de reconhecimento como «Somente área de legenda inferior» filtra outras distrações, acelera o processo e melhora a precisão; caso contrário, use «Imagem inteira».

Question 5

Os arquivos de vídeo são enviados a um servidor?

Accepted Answer

Não. A decodificação do vídeo, a captura de quadros e o reconhecimento OCR são executados localmente no seu navegador; o arquivo de vídeo nunca é enviado a nenhum servidor. O mecanismo de reconhecimento é baixado de uma CDN e armazenado em cache no seu navegador na primeira vez e depois pode ser reutilizado offline.

Question 6

O que fazer se os resultados não forem precisos?

Accepted Answer

A precisão do OCR depende da nitidez, do tamanho e do contraste do texto na tela. Se os resultados não forem ideais, tente: confirmar o idioma correto, usar um intervalo de amostragem menor, usar «Somente área de legenda inferior» para legendas inferiores, ou primeiro deixar o vídeo mais nítido com nossas outras ferramentas. É recomendável revisar os resultados exportados.

Extrair texto na tela do vídeo online

Reconhecimento OCR do texto na tela

Área selecionável + intervalo personalizado

Processamento local para proteger a privacidade

Casos de uso para extrair texto na tela de vídeo

Organização de conteúdo e estudo

Criação e trabalho

Passo a passo

Sobre a ferramenta de extração de texto na tela de vídeo

Perguntas frequentes