Question 1

Чем это отличается от «Извлечения субтитров из видео»?

Accepted Answer

Этот инструмент использует OCR (оптическое распознавание символов), чтобы «смотреть» видео покадрово и распознавать текст, впечатанный в изображение, — вшитые субтитры, заголовки, danmaku, текст водяных знаков и слова на экранах PPT/презентаций. А инструмент «Извлечение субтитров из видео» использует распознавание речи (ASR), чтобы «расшифровать» сказанное. Коротко: для текста на экране используйте этот инструмент, а для звучащей речи — инструмент субтитров.

Question 2

Как он распознаёт экранный текст?

Accepted Answer

В соответствии с заданным вами интервалом выборки инструмент захватывает видео покадрово в виде изображений, затем локальным OCR-движком в браузере распознаёт текст каждого кадра и в конце удаляет дубликаты, объединяя всё в текстовые сегменты с таймлайном. Весь процесс выполняется в вашем браузере, и видео никогда не загружается.

Question 3

Какие языки текста поддерживаются?

Accepted Answer

Поддерживаются китайский (упрощённый/традиционный), английский, японский, корейский, французский, немецкий, испанский, португальский, итальянский, русский, арабский, хинди, вьетнамский, турецкий, индонезийский и другие. Перед распознаванием выберите язык, соответствующий экранному тексту; для смеси китайского и английского выберите вариант «Китайский + English» для лучшего результата.

Question 4

Как выбрать интервал выборки и область распознавания?

Accepted Answer

Чем меньше интервал, тем полнее результат, но покадровый OCR медленнее, поэтому для длинных видео сначала попробуйте интервал 2–5 секунд. Если текст сосредоточен в нижней части кадра (типичные вшитые субтитры), выбор области распознавания «Только нижняя область субтитров» отсекает прочие помехи, ускоряет обработку и повышает точность; иначе используйте «Весь кадр».

Question 5

Загружаются ли видеофайлы на сервер?

Accepted Answer

Нет. Декодирование видео, захват кадров и распознавание текста OCR выполняются локально в вашем браузере; файл видео никогда не загружается ни на один сервер. Движок распознавания скачивается с CDN и кэшируется в браузере при первом использовании, а затем работает офлайн.

Question 6

Что делать, если результаты неточны?

Accepted Answer

Точность OCR зависит от чёткости, размера и контраста экранного текста. Если результаты неидеальны, попробуйте: убедиться в правильном языке, уменьшить интервал выборки, использовать «Только нижняя область субтитров» для нижних субтитров или сначала повысить чёткость видео нашими другими инструментами. Экспортированные результаты рекомендуется вычитать.

Извлечение текста с экрана видео онлайн

Распознавание экранного текста (OCR)

Выбираемая область + настраиваемый интервал

Локальная обработка защищает конфиденциальность

Сценарии использования извлечения экранного текста из видео

Организация контента и обучение

Творчество и работа

Шаги использования

Об инструменте извлечения экранного текста из видео

Часто задаваемые вопросы