वीडियो स्क्रीन का टेक्स्ट ऑनलाइन निकालें

OCR से वीडियो फ़्रेम के टेक्स्ट—हार्डकोडेड सबटाइटल, शीर्षक, danmaku, प्रेज़ेंटेशन टेक्स्ट—को पहचानें, टाइमलाइन वाला टेक्स्ट अपने-आप बनाएँ और एक क्लिक में TXT व SRT में निर्यात करें, सब कुछ आपके ब्राउज़र में स्थानीय रूप से प्रोसेस

स्क्रीन टेक्स्ट की OCR पहचान

वीडियो को फ़्रेम-दर-फ़्रेम «देखकर» जड़े टेक्स्ट—हार्डकोडेड सबटाइटल, शीर्षक, danmaku और वॉटरमार्क टेक्स्ट—को पहचानता है, जो ऑडियो-आधारित स्पीच रिकग्निशन का पूरक है

चयन-योग्य क्षेत्र + कस्टम अंतराल

अधिक सटीकता हेतु केवल नीचे का सबटाइटल क्षेत्र पहचानें, लचीले सैंपलिंग अंतराल के साथ जो गति और पूर्णता में संतुलन रखता है; परिणाम अपने-आप डुप्लिकेट हटाकर मिला दिए जाते हैं

स्थानीय प्रोसेसिंग से गोपनीयता सुरक्षा

फ़्रेम डिकोडिंग और टेक्स्ट पहचान दोनों आपके ब्राउज़र में स्थानीय रूप से चलते हैं; वीडियो कभी किसी सर्वर पर अपलोड नहीं होते, इसलिए निजी सामग्री भी सुरक्षित है

वीडियो फ़ाइल यहाँ खींचें

या

MP4, WebM, MOV, MKV, AVI आदि फॉर्मेट का समर्थन

वीडियो स्क्रीन टेक्स्ट निकालने के उपयोग-परिदृश्य

सामग्री व्यवस्थित करना और सीखना

  • कोर्स व लेक्चर रिकॉर्डिंग में PPT/बोर्ड पर लिखे टेक्स्ट को निकालकर खोज-योग्य नोट्स में व्यवस्थित करें
  • हार्डकोडेड सबटाइटल (छवि में जड़े सबटाइटल) वाले वीडियो का टेक्स्ट निकालकर ट्रांसक्रिप्ट या अध्ययन सामग्री बनाएं
  • ट्यूटोरियल व डेमो वीडियो में स्क्रीन पर दिखने वाले कोड, कमांड और चरण-दर-चरण टेक्स्ट को निकालें

रचना और कार्यालय

  • शॉर्ट वीडियो के शीर्षक, danmaku और स्टिकर टेक्स्ट निकालकर पुनः उपयोग और विश्लेषण करें
  • जिन वीडियो में केवल हार्डकोडेड सबटाइटल हों और अलग सबटाइटल फ़ाइल न हो, उनसे संपादन-योग्य SRT पुनर्प्राप्त करें
  • प्रोडक्ट डेमो और लॉन्च रिकॉर्डिंग की स्लाइड्स से मुख्य जानकारी और डेटा निकालें

उपयोग के चरण

1

वीडियो अपलोड करें

अपलोड क्षेत्र पर क्लिक करें या वीडियो फाइल ड्रैग करें। MP4, MKV, WebM, MOV आदि सपोर्ट।

2

भाषा और पहचान क्षेत्र चुनें

स्क्रीन टेक्स्ट की भाषा चुनें, और आवश्यकता अनुसार पूरी स्क्रीन या केवल नीचे का सबटाइटल क्षेत्र चुनें

3

पहचान शुरू करें

«टेक्स्ट पहचान शुरू करें» पर क्लिक करें, OCR स्थानीय रूप से फ़्रेम-दर-फ़्रेम स्क्रीन टेक्स्ट पहचानता है

4

झलक देखें और एक्सपोर्ट करें

परिणामों का पूर्वावलोकन करें, TXT/SRT डाउनलोड करें या एक क्लिक में सादा टेक्स्ट कॉपी करें

वीडियो स्क्रीन टेक्स्ट एक्सट्रैक्टर टूल के बारे में

VideoKit का वीडियो स्क्रीन टेक्स्ट एक्सट्रैक्टर WebCodecs और स्थानीय OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) पर आधारित है: यह पहले वीडियो को फ़्रेम-दर-फ़्रेम छवियों में डिकोड करता है, फिर हर फ़्रेम में दिखने वाले टेक्स्ट को पहचानता है और अपने-आप डुप्लिकेट हटाकर टाइमलाइन वाले टेक्स्ट में मिला देता है।

यह «छवि में जड़े» टेक्स्ट—जैसे हार्डकोडेड सबटाइटल, शीर्षक, danmaku, वॉटरमार्क और प्रेज़ेंटेशन स्क्रीन के शब्द—को पहचानने के लिए बनाया गया है। यदि आप ऑडियो से लिखे गए सबटाइटल चाहते हैं, तो «वीडियो सबटाइटल निकालें» (स्पीच रिकग्निशन) टूल इस्तेमाल करें।

सारी प्रोसेसिंग आपके ब्राउज़र में स्थानीय रूप से होती है; वीडियो और पहचाना गया टेक्स्ट कभी आपके डिवाइस से बाहर नहीं जाता। Chrome या Edge की सलाह है; OCR की गुणवत्ता स्क्रीन टेक्स्ट की स्पष्टता, आकार और कंट्रास्ट पर निर्भर करती है, इसलिए निर्यात के बाद जाँच की सलाह दी जाती है।

अक्सर पूछे जाने वाले प्रश्न

यह «वीडियो सबटाइटल निकालें» से कैसे अलग है?

यह टूल OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) का उपयोग करके वीडियो को फ़्रेम-दर-फ़्रेम «देखता» है और छवि में जड़े टेक्स्ट—जैसे हार्डकोडेड सबटाइटल, शीर्षक, danmaku, वॉटरमार्क टेक्स्ट और PPT/प्रेज़ेंटेशन स्क्रीन के शब्द—को पहचानता है। जबकि «वीडियो सबटाइटल निकालें» टूल स्पीच रिकग्निशन (ASR) से जो कहा गया उसे «लिखता» है। संक्षेप में: स्क्रीन पर टेक्स्ट के लिए यह टूल, और बोले गए ऑडियो के लिए सबटाइटल टूल इस्तेमाल करें।

यह स्क्रीन टेक्स्ट को कैसे पहचानता है?

आपके तय किए सैंपलिंग अंतराल के अनुसार टूल वीडियो को फ़्रेम-दर-फ़्रेम छवियों में कैप्चर करता है, फिर ब्राउज़र में स्थानीय OCR इंजन से हर फ़्रेम का टेक्स्ट पहचानता है, और अंत में डुप्लिकेट हटाकर उन्हें टाइमलाइन वाले टेक्स्ट खंडों में मिला देता है। पूरी प्रक्रिया आपके ब्राउज़र में होती है और वीडियो कभी अपलोड नहीं होता।

किन भाषाओं का टेक्स्ट समर्थित है?

चीनी (सरलीकृत/पारंपरिक), अंग्रेज़ी, जापानी, कोरियाई, फ़्रेंच, जर्मन, स्पेनिश, पुर्तगाली, इतालवी, रूसी, अरबी, हिंदी, वियतनामी, तुर्की, इंडोनेशियाई आदि समर्थित हैं। पहचान से पहले स्क्रीन टेक्स्ट से मेल खाती भाषा चुनें; चीनी और अंग्रेज़ी मिश्रित होने पर बेहतर परिणाम हेतु «चीनी + English» विकल्प चुनें।

सैंपलिंग अंतराल और पहचान क्षेत्र कैसे चुनें?

अंतराल जितना छोटा होगा पहचान उतनी पूर्ण होगी, पर फ़्रेम-दर-फ़्रेम OCR धीमा होता है, इसलिए लंबे वीडियो में पहले 2~5 सेकंड का अंतराल आज़माएँ। यदि टेक्स्ट स्क्रीन के नीचे केंद्रित है (सामान्य हार्डकोडेड सबटाइटल), तो पहचान क्षेत्र को «केवल नीचे का सबटाइटल क्षेत्र» पर सेट करने से अन्य बाधाएँ फ़िल्टर होती हैं, गति बढ़ती है और सटीकता सुधरती है; अन्यथा «पूरी स्क्रीन» इस्तेमाल करें।

क्या वीडियो फ़ाइल सर्वर पर अपलोड होती है?

नहीं। वीडियो डिकोडिंग, फ़्रेम कैप्चर और OCR टेक्स्ट पहचान सब आपके ब्राउज़र में स्थानीय रूप से होते हैं; वीडियो फ़ाइल कभी किसी सर्वर पर अपलोड नहीं होती। पहचान इंजन पहली बार इस्तेमाल पर CDN से डाउनलोड होकर ब्राउज़र में कैश होता है, फिर ऑफ़लाइन दोबारा उपयोग किया जा सकता है।

अगर परिणाम सटीक न हों तो क्या करें?

OCR की सटीकता स्क्रीन टेक्स्ट की स्पष्टता, आकार और कंट्रास्ट पर निर्भर करती है। परिणाम आदर्श न हों तो आज़माएँ: सही भाषा की पुष्टि करें, छोटा सैंपलिंग अंतराल इस्तेमाल करें, नीचे के सबटाइटल के लिए «केवल नीचे का सबटाइटल क्षेत्र» इस्तेमाल करें, या पहले हमारे अन्य टूल से वीडियो को स्पष्ट करें। निर्यात किए परिणामों को एक बार जाँच लेना अच्छा रहता है।