Извлечение текста с экрана видео онлайн

Используйте OCR для распознавания текста в кадрах видео — вшитых субтитров, заголовков, danmaku, текста презентаций — с автоматическим созданием текста с таймлайном и экспортом в TXT и SRT в один клик, всё обрабатывается локально в вашем браузере

Распознавание экранного текста (OCR)

Читает видео покадрово, распознавая впечатанный текст — вшитые субтитры, заголовки, danmaku и текст водяных знаков, — дополняя распознавание речи по звуку

Выбираемая область + настраиваемый интервал

Распознавайте только нижнюю область субтитров для большей точности, с гибким интервалом выборки, балансирующим скорость и полноту; результаты автоматически дедуплицируются и объединяются

Локальная обработка защищает конфиденциальность

Декодирование кадров и распознавание текста выполняются локально в вашем браузере; видео никогда не загружается на сервер, поэтому даже приватный контент в безопасности

Перетащите видеофайлы сюда

или

Поддержка форматов MP4, WebM, MOV, MKV, AVI

Сценарии использования извлечения экранного текста из видео

Организация контента и обучение

  • Извлекайте текст с PPT/досок в записях курсов и лекций и организуйте его в удобные для поиска заметки
  • Извлекайте текст из видео с вшитыми субтитрами (субтитрами, впечатанными в кадр), чтобы создавать расшифровки или учебные материалы
  • Извлекайте код, команды и пошаговый текст, отображаемый на экране в обучающих и демонстрационных видео

Творчество и работа

  • Извлекайте заголовки, danmaku и текст стикеров из коротких видео для переработки и анализа
  • Восстанавливайте редактируемый SRT из видео, где есть только вшитые субтитры и нет отдельного файла субтитров
  • Извлекайте ключевую информацию и данные со слайдов в записях демонстраций продуктов и презентаций

Шаги использования

1

Загрузите видео

Нажмите на область загрузки или перетащите видеофайл. Поддерживает MP4, MKV, WebM, MOV и другие.

2

Выбор языка и области распознавания

Выберите язык экранного текста и при необходимости весь кадр или только нижнюю область субтитров

3

Начать распознавание

Нажмите «Начать распознавание текста», и OCR распознает экранный текст покадрово локально

4

Предпросмотр и экспорт

Просмотрите результаты, скачайте TXT/SRT или скопируйте простой текст в один клик

Об инструменте извлечения экранного текста из видео

Инструмент извлечения экранного текста VideoKit основан на WebCodecs и локальном OCR (оптическом распознавании символов): сначала он декодирует видео покадрово в изображения, затем распознаёт текст, появляющийся в каждом кадре, и автоматически дедуплицирует и объединяет его в текст с таймлайном.

Он предназначен для распознавания текста, «впечатанного в кадр», — вшитых субтитров, заголовков, danmaku, водяных знаков и текста на экранах презентаций. Если вам нужны субтитры, расшифрованные из звука, используйте инструмент «Извлечение субтитров из видео» (распознавание речи).

Вся обработка выполняется локально в вашем браузере; видео и распознанный текст никогда не покидают ваше устройство. Рекомендуется Chrome или Edge; качество OCR зависит от чёткости, размера и контраста экранного текста, поэтому после экспорта рекомендуется вычитка.

Часто задаваемые вопросы

Чем это отличается от «Извлечения субтитров из видео»?

Этот инструмент использует OCR (оптическое распознавание символов), чтобы «смотреть» видео покадрово и распознавать текст, впечатанный в изображение, — вшитые субтитры, заголовки, danmaku, текст водяных знаков и слова на экранах PPT/презентаций. А инструмент «Извлечение субтитров из видео» использует распознавание речи (ASR), чтобы «расшифровать» сказанное. Коротко: для текста на экране используйте этот инструмент, а для звучащей речи — инструмент субтитров.

Как он распознаёт экранный текст?

В соответствии с заданным вами интервалом выборки инструмент захватывает видео покадрово в виде изображений, затем локальным OCR-движком в браузере распознаёт текст каждого кадра и в конце удаляет дубликаты, объединяя всё в текстовые сегменты с таймлайном. Весь процесс выполняется в вашем браузере, и видео никогда не загружается.

Какие языки текста поддерживаются?

Поддерживаются китайский (упрощённый/традиционный), английский, японский, корейский, французский, немецкий, испанский, португальский, итальянский, русский, арабский, хинди, вьетнамский, турецкий, индонезийский и другие. Перед распознаванием выберите язык, соответствующий экранному тексту; для смеси китайского и английского выберите вариант «Китайский + English» для лучшего результата.

Как выбрать интервал выборки и область распознавания?

Чем меньше интервал, тем полнее результат, но покадровый OCR медленнее, поэтому для длинных видео сначала попробуйте интервал 2–5 секунд. Если текст сосредоточен в нижней части кадра (типичные вшитые субтитры), выбор области распознавания «Только нижняя область субтитров» отсекает прочие помехи, ускоряет обработку и повышает точность; иначе используйте «Весь кадр».

Загружаются ли видеофайлы на сервер?

Нет. Декодирование видео, захват кадров и распознавание текста OCR выполняются локально в вашем браузере; файл видео никогда не загружается ни на один сервер. Движок распознавания скачивается с CDN и кэшируется в браузере при первом использовании, а затем работает офлайн.

Что делать, если результаты неточны?

Точность OCR зависит от чёткости, размера и контраста экранного текста. Если результаты неидеальны, попробуйте: убедиться в правильном языке, уменьшить интервал выборки, использовать «Только нижняя область субтитров» для нижних субтитров или сначала повысить чёткость видео нашими другими инструментами. Экспортированные результаты рекомендуется вычитать.