VIDEOSUBFINDER & ABBYY

자유게시판

VIDEOSUBFINDER & ABBYY

1 써머셋모옴 8 333 1
안녕하세요...
제작자 포럼에 써야 하는 글이지만
좀 더 많이 토론되었으면 하는 마음에서 써봅니다.

비디오 영상에 하드코딩된 자막을 추출하는 문제인데요.
현재 씨네스트에서는 VIDEOSUBFINDER로 추출한 텍스트를 구글 계정으로 인코딩하는
방법만 논의되는 걸로 알아요

하지만 저처럼 ABBYY로 텍스트를 OCR 하는 사람들을 위한 가이드는 거의 없더군요,
결국 유 투브 보고 성공했지만 마지막 순간에
VIDEOSUBFINDER  와 ABBYY의 인코딩 체계가 달라서
글자가 다 깨어져서 출력 되더군요,
그 부분에 대해서는 아래 블로그에서 적혀 있는데
주인장이 컴 박사여서 완전 불친절하게 설명해 놓았더군요,

https://m.blog.naver.com/22wowow22/222081510666


혹시 위의 칼럼을 읽어보시고 저 마지막 단계를
좀 쉽게 설명해주실 분이 없을까 하고 자유게시판에 올려봅니다

취지에 맞지 않다면 운영자분께서 제작자 포럼에 올리셔도 됩니다
과연 답을 얻을 수 있을 지 두근거리는 마음으로 기다려봅니다.
Facebook Twitter GooglePlus KakaoStory NaverBand 신고

Author

Lv.1 1 써머셋모옴  실버(2등급)
109 (10.9%)

까칠이

 
8 Comments
36 Wikid  
블로그 저자가 FileDirectoryNamer라는 윈도우 프로그램을 직접 제작했고
9번에 나오는 코드를 추가해서 문제를 해결했나봅니다.

해당 프로그램을 공개한게 아니라면...
다른 인코딩 변환 툴 등을 구해 시도해봐야 하지 않을까 싶네요.
(VideoSubFinder와 ABBYY의 인코딩 방식이 무엇인지는 모르겠지만)
1 써머셋모옴  
네.. 언젠가는 우리 시네스트에도 VideoSubFinder에서 이미지 텍스트를 뽑아와
구글 계정 OCR 추출이 아니라
ABBYY를 이용하는 방법도 가르쳐 줄
고수가 나오겠죠.
그때를 손꼽아 기다려 볼려구요...

참고로 전 무분별하게 DM걸린 저작물들은 보호되어야 한다고 믿는 1인입니다.
제가 하고싶은 건 옛날 비디오 테입에서 하드코딩 자막을 뽑아보려 합니다.
자막도 자막이지만 싱크 시간을 줄일 수 있거든요.
답변 감사드립니다.

무플인줄 알고 조마 했습니다.
30 여보밥줘  
링크의 설명을 보면 비디오섭파인더에서 추출한 이미지를 매 이미지마다 OCR변환 하는 것으로 보이는데 맞나요?
이렇게 추출된 이미지 하나하나 마다 srt 파일이 생성되고 이렇게 생성된 수 많은 srt 파일을 하니의 srt 파일로 만드는데 문제가 있는 게 맞나요?
혹시 ABBYY 라는 프로그램에서 만들어진 많은 srt 파일을 하나로 만드는 부분에서 문제가 되는 거라면
ABBYY에서 만들어진 파일들을 제게 주시면 하나의 srt 파일로 바꾸는 프로그램을 만들어볼 수 있습니다
인코딩이라는 게 결국 ansi나 utf8 등 몇 가지가 안 되기 때문에 그렇게 어려운 건 아닐 것 같습니다
제가 c#은 잘 모르지만 링크의 그 코드는 ansi(ABBYY에서 OCR한 텍스트)로 인코딩 된 텍스트를 utf8로 인코딩해서 저장하는 거로 보입니다
1 써머셋모옴  
안녕하세요
친절한 답변 너무나 감사드립니다.

https://archive.vn/wvFOW

위의 How to Extract Hardcoded Subtitles from Videos?
를 보면 마지막 스텝7 까지 무사히 갔는데
스텝 8에서
"Create Sub From TXT Results" 를 누르면
저 분 말씀대로라면 srt 통파일이 만들어져야 하는 게 맞는데
저 분은 영어 이기 때문에 무사히 저 과정으로 넘어간 것 같습니다.

하지만 한국어 인코딩은 아래 분 말씀처럼
https://m.blog.naver.com/22wowow22/222081510666

VIDEOSUBFINDER & ABBYY 가 서로 충돌을 일으키는 것 같습니다.
평소에 여보밥줘님 칼럼을 흥미 있고 관심 있게 보고 있는 1인입니다.
제가 소정의 감사의 사례를 할 마음이 있습니다.
(현금이 싫으시면 뭐, 코스트코 상품권이라도 드리겠습니다)
그 정도로 저로는 꼭 알고 싶은 과정이오니
ABBYY에서 출력한 출력물에 VIDEOSUBFINDER 과정을 통과하면
왜 모든 글자가 깨어져 버리는지를 꼭 알고 싶습니다.
참고로 ABBYY가 스캔한 한글 srt 통 파일은 "Create Sub From TXT Results"  폴더에 들어 있는데
거의 정확도로 85% 정도 될 정도로 놀라웠습니다.

그런데 VIDEOSUBFINDER 에서 "Create Sub From TXT Results"  클릭 이 과정을 그치면
모든 글자가 깨어져 버립니다.

부디 이 문제를 해결해 주시면 정말 많은 VHS 시대가 디지틀로 넘어오는 계기가 되지 않을까 싶습니다.

다시 한 번 감사드립니다
30 여보밥줘  
댓글내용 확인
1 써머셋모옴  
댓글내용 확인
1 써머셋모옴  
안녕하세요.
제가  VIDEOSUBFINDER에서 추출한 크리어 텍스트를 여보밥줘님의 계정에 올리려 해도
파일 수가 많다고 안된다고 하네요.
혹시 이메일로 보낼 수 없을까요?
제가 알집으로 압축을 해놓았거든요.
번거롭게 해서 죄송합니다.
30 여보밥줘  
댓글내용 확인