Question 1

Công cụ này khác gì với «Trích xuất phụ đề video»?

Accepted Answer

Công cụ này dùng OCR (nhận dạng ký tự quang học) để «nhìn» video theo từng khung hình và nhận dạng văn bản được nung vào hình ảnh, như phụ đề cứng, tiêu đề, danmaku, chữ hình mờ và chữ trên màn hình PPT/thuyết trình. Còn công cụ «Trích xuất phụ đề video» dùng nhận dạng giọng nói (ASR) để «chép lại» những gì được nói. Nói ngắn gọn: chữ trên màn hình thì dùng công cụ này, âm thanh lời nói thì dùng công cụ phụ đề.

Question 2

Công cụ nhận dạng văn bản màn hình như thế nào?

Accepted Answer

Theo khoảng lấy mẫu bạn đặt, công cụ chụp video thành ảnh theo từng khung hình, rồi dùng bộ máy OCR cục bộ trong trình duyệt để nhận dạng văn bản của mỗi khung, và cuối cùng loại bỏ trùng lặp, gộp thành các đoạn văn bản kèm mốc thời gian. Toàn bộ quá trình chạy trong trình duyệt của bạn và video không bao giờ được tải lên.

Question 3

Hỗ trợ văn bản những ngôn ngữ nào?

Accepted Answer

Hỗ trợ tiếng Trung (giản thể/phồn thể), tiếng Anh, tiếng Nhật, tiếng Hàn, tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha, tiếng Bồ Đào Nha, tiếng Ý, tiếng Nga, tiếng Ả Rập, tiếng Hindi, tiếng Việt, tiếng Thổ Nhĩ Kỳ, tiếng Indonesia và nhiều ngôn ngữ khác. Trước khi nhận dạng, hãy chọn ngôn ngữ khớp với văn bản màn hình; nếu lẫn tiếng Trung và tiếng Anh, hãy chọn tùy chọn «Tiếng Trung + English» để có kết quả tốt hơn.

Question 4

Chọn khoảng lấy mẫu và vùng nhận dạng thế nào?

Accepted Answer

Khoảng càng nhỏ thì nhận dạng càng đầy đủ, nhưng OCR theo từng khung hình chậm hơn, nên với video dài hãy thử khoảng 2–5 giây trước. Nếu văn bản tập trung ở phần dưới khung hình (phụ đề cứng điển hình), đặt vùng nhận dạng thành «Chỉ vùng phụ đề dưới» sẽ lọc bỏ nhiễu khác, tăng tốc và cải thiện độ chính xác; nếu không, hãy dùng «Toàn bộ khung hình».

Question 5

Tệp video có được tải lên máy chủ không?

Accepted Answer

Không. Việc giải mã video, chụp khung hình và nhận dạng văn bản OCR đều chạy cục bộ trong trình duyệt của bạn; tệp video không bao giờ được tải lên bất kỳ máy chủ nào. Bộ máy nhận dạng được tải từ CDN và lưu vào bộ nhớ đệm trình duyệt trong lần đầu sử dụng, sau đó có thể dùng lại ngoại tuyến.

Question 6

Kết quả không chính xác thì phải làm sao?

Accepted Answer

Độ chính xác của OCR phụ thuộc vào độ rõ, cỡ chữ và độ tương phản của văn bản màn hình. Nếu kết quả chưa lý tưởng, hãy thử: xác nhận đúng ngôn ngữ, dùng khoảng lấy mẫu nhỏ hơn, dùng «Chỉ vùng phụ đề dưới» cho phụ đề ở dưới, hoặc làm nét video trước bằng các công cụ khác của chúng tôi. Nên rà soát lại kết quả sau khi xuất.

Trích xuất văn bản trên màn hình video trực tuyến

Nhận dạng văn bản màn hình bằng OCR

Vùng có thể chọn + khoảng tùy chỉnh

Xử lý cục bộ bảo vệ quyền riêng tư

Trường hợp sử dụng trích xuất văn bản màn hình video

Sắp xếp nội dung và học tập

Sáng tạo và văn phòng

Các bước sử dụng

Giới thiệu công cụ trích xuất văn bản màn hình video

Câu hỏi thường gặp