영상 자제 자막 추출
개인적으로 영상의 자제 자막(하드섭이라 불리는)을 추출할 일이 있어서 자막의 타임 코드를 검출하고,
검출한 타임코드 프레임에 있는 자막을 Teseract OCR를 이용해 자막을 추출하는 프로그램을 만들었습니다.
하지만 Tesseract OCR의 인식율이 너무 낮아서 사용할 수 없는 상태가 돼버렸습니다.
그래서 대안을 고민하다가 구글 Vision API의 OCR 인식 성능이 만족할 만한 수준이라는 걸 알았습니다.
다만 구글 Vision API는 비용이 들어가기 때문에 구글 드라이브를 이용하면 공짜로 이용할 수 있는 방법이 있습니다.
자막 이미지를 구글 드라이브에 올린 다음에 Open With->Google Doc로 불러오면 이미지 속 텍스트를 추출해 줍니다.
그런데 이미지 하나씩 위의 작업을 반복하면 너무 비효율적이라 이미지를 합친 다음 올리면 더 편하게 이미지를 텍스트로 변환할 수 있습니다.
이 작업을 해주는 python 코드를 첨부하니 필요하신 분은 받아서 사용하세요.
소스에서는 Videosubfinder에서 캡처한 이미지를 합치는 걸로 작성했습니다.
실행은 python imgmerge.py 하시면 되고, 디렉토리는 videosubfinder가 설치된 경로로 바꿔주시면 됩니다.
(python이 설치가 되어 있어야 하고, 소스에 필요한 python 패키지를 설치해야 합니다.
필요한 패키지는 소스 맨 위에 적혀 있습니다.)
20 Comments