Question 1

Worin unterscheidet es sich von „Untertitel aus Video extrahieren“?

Accepted Answer

Dieses Tool nutzt OCR (optische Zeichenerkennung), um das Video Bild für Bild zu „betrachten“ und den ins Bild eingebrannten Text zu erkennen – etwa eingebrannte Untertitel, Titel, Danmaku, Wasserzeichentext und Wörter auf PPT-/Präsentationsbildschirmen. Das Tool „Untertitel aus Video extrahieren“ nutzt dagegen Spracherkennung (ASR), um das Gesprochene zu „transkribieren“. Kurz gesagt: für Text auf dem Bildschirm dieses Tool, für gesprochenes Audio das Untertitel-Tool.

Question 2

Wie wird der Bildschirmtext erkannt?

Accepted Answer

Anhand des von dir festgelegten Abtastintervalls erfasst das Tool das Video Bild für Bild als Bilder, erkennt dann mit einer lokalen OCR-Engine im Browser den Text jedes Bildes und entfernt schließlich Duplikate und fügt alles zu Textsegmenten mit Zeitachse zusammen. Der gesamte Vorgang läuft in deinem Browser und das Video wird nie hochgeladen.

Question 3

Welche Textsprachen werden unterstützt?

Accepted Answer

Unterstützt werden Chinesisch (vereinfacht/traditionell), Englisch, Japanisch, Koreanisch, Französisch, Deutsch, Spanisch, Portugiesisch, Italienisch, Russisch, Arabisch, Hindi, Vietnamesisch, Türkisch, Indonesisch und mehr. Wähle vor der Erkennung die zum Bildschirmtext passende Sprache; bei gemischtem Chinesisch und Englisch wähle die Option „Chinesisch + English“ für bessere Ergebnisse.

Question 4

Wie wähle ich Abtastintervall und Erkennungsbereich?

Accepted Answer

Ein kleineres Intervall liefert vollständigere Ergebnisse, aber die OCR Bild für Bild ist langsamer; probiere bei langen Videos daher zuerst ein Intervall von 2–5 Sekunden. Wenn sich der Text im unteren Bildbereich konzentriert (typische eingebrannte Untertitel), filtert die Einstellung „Nur unterer Untertitelbereich“ andere Störungen heraus, beschleunigt den Vorgang und verbessert die Genauigkeit; ansonsten verwende „Ganzes Bild“.

Question 5

Werden die Videodateien auf einen Server hochgeladen?

Accepted Answer

Nein. Videodecodierung, Bilderfassung und OCR-Texterkennung laufen alle lokal in deinem Browser; die Videodatei wird nie auf einen Server hochgeladen. Die Erkennungs-Engine wird bei der ersten Nutzung von einem CDN heruntergeladen und im Browser zwischengespeichert und ist danach offline wiederverwendbar.

Question 6

Was tun, wenn die Ergebnisse nicht genau sind?

Accepted Answer

Die OCR-Genauigkeit hängt von Schärfe, Größe und Kontrast des Bildschirmtexts ab. Wenn die Ergebnisse nicht ideal sind, versuche: die richtige Sprache bestätigen, ein kleineres Abtastintervall verwenden, für untere Untertitel „Nur unterer Untertitelbereich“ nutzen oder das Video zuerst mit unseren anderen Tools schärfen. Es empfiehlt sich, die exportierten Ergebnisse Korrektur zu lesen.

Bildschirmtext aus Video online extrahieren

OCR-Erkennung von Bildschirmtext

Wählbarer Bereich + individuelles Intervall

Lokale Verarbeitung schützt die Privatsphäre

Anwendungsfälle für das Extrahieren von Bildschirmtext aus Videos

Inhalte ordnen und lernen

Kreation und Büro

So wird's gemacht

Über das Tool zum Extrahieren von Bildschirmtext aus Videos

Häufig gestellte Fragen