하드섭, 자체자막 영상의 자막 추출가이드 (추가팁, 및 사용기)

자막제작자포럼

하드섭, 자체자막 영상의 자막 추출가이드 (추가팁, 및 사용기)

3 무슈 0 270 2



이글은 구글 API 의 인식률 오차 범위를 줄이기 위해 쓰게 된 글입니다.




자체자막, 하드섭 등  같은표현인데, 자동으로 작업 하기 위해서는 몇개의 파일을 다운로드 받아야 합니다.



◆ Google Docs OCR V3

 https://workupload.com/file/4KvYJvH8SFWhttps://workupload.com/file/4KvYJvH8SFW


Python3.10


32-bit

https://www.python.org/ftp/python/3.9.13/python-3.9.13.exe


64-bit

https://www.python.org/ftp/python/3.9.13/python-3.9.13-amd64.exe


◆ Delete_All_Files_Google_Drive

https://mega.nz/file/20BClQaR#4W3jm9bLdx56LNX7ecYAleYS3oak7clOr-tRZ8LaezY 


 Cleaning_images_text

https://workupload.com/file/j73mbYyR7GG


◆ Video Sub Finder

https://www.videohelp.com/software/VideoSubFinder 




위 파일들의 사용법은 아주 아주 자세하게 설명되 있는 "notnrwk" 님의 글 1편과 2편을 참고하시면 됩니다.


※ 영상에 하드코딩된 내장자막 자동추출 가이드 - 1


※ 영상에 하드코딩된 내장자막 자동추출 가이드 - 2

https://cineaste.co.kr/bbs/board.php?bo_table=psd_capmakef&wr_id=31011&sca=%EC%9E%90%EB%A7%89%EC%A0%9C%EC%9E%91%EA%B0%80%EC%9D%B4%EB%93%9C 




◆ 다운 받은 파일들을 사용하기 위해서는 각 파일들 마다 Support 폴더가 들어있습니다.  

Support 폴더안에 보면 Install pip Pack.bat 파일을 실행시켜주면 사용가능 하게 됩니다. (가장먼저, 파이썬 프로그램 부터 설치 한후에 각 파일들의 bat 파일을 실행하시면 됩니다)



위 파일들중에 "notnrwk" 님께서 다루지 않은 Cleaning_images_text 사용기를 공유하겠습니다.


다운로드 받은후 압축을 풀고 폴더를 보면,


bafa4accf00ddafd5fd35a64efa31865_1702812101_0073.png
이렇게 파일들이 있습니다. 가장 먼저 Support 폴더안에 보면 Install pip Pack.bat 파일을 실행시켜 사용가능 하게 해주시면 됩니다. 중복 실행해도 상관없습니다.




◎ 사용법은 어렵지 않습니다. 


VideoSubFinder 로 자막부분 을 추출한 RGBImages 폴더를 복사한 후에 


Original_Images 폴더안에 RGBImages 폴더를 그대로 복사해 줍니다.



Output_ Black, White, Smoothing 세가지가 있는데, 주로 저의경우 블랙을 자주 사용합니다.


Output_Images_Background_Black 을 예로 들면,


Original_Images 폴더안에 자막부분을 추출한 이미지가 들어있는 폴더를 위치 시킨후에


Cleaning_Text_Images_Black_Background.py  를 실행시켜 줍니다. (더블클릭으로 실행됨 - 파이썬이 설치되있다면.)



bafa4accf00ddafd5fd35a64efa31865_1702812987_7289.png

각자 맞게 조정 해준 후에, S 버튼을 누르면 끝납니다. 

단축키는 2개가 있습니다.

S = 모든 추출파일들 바탕색 검은색(흰색) 으로변환,   Q = 해당 스크립터 닫기 


위 방법으로 비율을 조정해주면 바탕색이 검은색(흰색) 이 되며, 글자는 흰색(검은색) 으로 좀더 인식률이 올라갑니다.


방금의 작업의 결과물은,



bafa4accf00ddafd5fd35a64efa31865_1702813130_6928.jpeg


배경이 검은색으로 바뀌면서 인식률이 더 올라갑니다.


작업이 끝난 결과물은 블랙으로 작업 했으므로, Output_Images_Background_Black 폴더에 저장되어 있습니다.

(이렇게 작업한 폴더를 다시 통채로 복사해서  Google Docs OCR V3 / images 폴더에 복사한 후 구글 API로 작업하면 됩니다)




구글이 만든 SRT 자막을 SubtitleEdit 로 불러와서 2가지 작업을 해 줍니다.


도구 - 일반적인 오류 수정 / 도구 - 동일한 텍스트 라인 병합하기


그리고,




모든 작업이 끝난 SRT 자막으로 만들어진 결과물은, 


1

0:06:17,543 --> 0:06:22,114

끊임없이 흐르는 육즙은

고기의 주스라고도 불리지


2

0:06:23,082 --> 0:06:26,017

그래서 비싼 값에 거래되는구나


3

0:06:26,018 --> 0:06:28,086

잘 아네, 로빈 씨


4

0:06:28,955 --> 0:06:32,057

저걸 보면

알 수밖에 없지, 코코


5

0:06:33,393 --> 0:06:37,062

|

고가라면 보석도 먹는

캐럿쥬시의 뼈는


6

0:06:37,063 --> 0:06:40,198

몇천 캐럿의

다이아몬드라는 얘기가 있어


7

0:06:41,234 --> 0:06:44,102

반드시 손에 넣겠어!


8

0:06:44,103 --> 0:06:45,370

그렇군







대충 이런식으로 인식률이 향상되며, " 쌍따옴표 와  오타도 많이 줄어듭니다. 

-야호
-야호!   이런식의 문장도 50%이상 손대지 않아도 될 만큼 좋아졌습니다.





하드섭, 자체자막 작업하시는 분들은 한번쯤 참고해볼만 할 듯 합니다.




Facebook Twitter GooglePlus KakaoStory NaverBand 신고
0 Comments