notepad++ 자막 관련 스크립트(번역, ocr, sub 싱크 오류 수정)

자유게시판

notepad++ 자막 관련 스크립트(번역, ocr, sub 싱크 오류 수정)

23 이미나에게로 3 221 0

notepad++ 자막에 관련 파이썬 스크립트입니다.(번역, ocr, sub 싱크 오류 수정)


notepad819 32bit PythonScript309 win7 x.z01

notepad819 32bit PythonScript309 win7 x.zip

압축파일(아래링크)은 https://notepad-plus-plus.org/ 최신버전 무설치 버전+ https://github.com/bruderstein/PythonScript +아래 3개 스크립트 파일입니다.


srt 자막 참고 사이트

https://github.com/wyb330/MakehardSub

https://stackoverflow.com/questions/2616766/parsing-srt-subtitles/37056709 


스크립트 참고

http://npppythonscript.sourceforge.net/docs/latest/


파이썬 강좌

https://www.youtube.com/watch?v=kWiCuklohdY


스크립트 파일은 plugins\Config\PythonScript\scripts\*.py에 있습니다.



누락된자막.py

.srt자막만 수정할 수 있습니다.

ocr하거나, 자막 번역할 때 다른 나라 언어 자막과 비교해 빠진 부분을 찾아내 저장합니다.(ocr 캡쳐 누락, 인명/지명 화면 설명)

원어가 영어인 기반 자막으로 번역할 때, 한글 자막을 번역/ocr할 때

원어가 아닌 다른 나라 정식 자막(불어, 스페인어)를 참고 자막으로 자막2로 하고, 

번역한/ocr한 정식 sub 자막을 자막2로하고 ocr한 캡쳐 자막을 자막1합니다.

검수할 자막1과 참고할 자막2을 엽니다. 검사할 자막1 창을 활성화 합니다.

4f7e9bd7a47cdbca9916fe4a07038819_1637763609_152.png
 

메뉴 -> 플러그인 -> Python Script -> 실행한 스크립트 선택

4f7e9bd7a47cdbca9916fe4a07038819_1637763641_4537.png
 

겹치는 싱크 값을 새로 입력하거나 엔터키를 누릅니다.

4f7e9bd7a47cdbca9916fe4a07038819_1637763668_9959.png

'누락된자막.srt' 에 저장하고 완료되면 메세지 창을 띄웁니다.

4f7e9bd7a47cdbca9916fe4a07038819_1637763681_2601.png
비교하는 자막은 소스가 같아야 합니다. 블루레이이면 블루레이 용으로 싱크를 맞추고 비교하셔야 합니다. 중간에 삭제, 감독판 길이가 다르면 안 됩니다.

중간에 광고가 있는 드라마보다 영화가 더 적합한 것 같습니다.

싱크만 있어도 될 것 같습니다. 블루레이나 dvd 추출한 sup,sub 싱크만 추출하고 누락 부분을 찾을 수 있겠네요.

누락자막체크.exe 도 사용법은 비슷합니다.

4f7e9bd7a47cdbca9916fe4a07038819_1637772888_2578.png

 

dvd에서 추출한 sub 자막 싱크가 꼬여 있을 때 - idx 오류 수정.py

.srt자막만 수정할 수 있습니다.

dvd에서 추출한 sub자막이 싱크 꼬임 수정 1-6-2-7-3-4-8-5 --> 1-2-3-4-5-6-7-8

aaa.srt, aaa.idx(.sub) 이름을 같고 하고 같은 폴더에 aaa.idx 위치하고 aaa.srt 열고 스크립트 수정

싱크 수정된 자막은 '-fixed.srt' 에 저장하고 완료되면 메세지 창을 띄웁니다.

전보다 3배이상 시간이 걸렸네요.

https://cineaste.co.kr/bbs/board.php?bo_table=psd_capmakef&wr_id=26254



[께꺼껄껍껀] 교정.py

한글 '께꺼껄껍껀' --> '게거걸건건'으로 수정, notepad++에 열린 파일은 교정됩니다.

교정할 자막을 열고 스크립트 실행하면 notepad++열린 자막은 교정되고

실행하면 모두 교정할 건지 '께꺼껄껍껀', '께'를 빼고 '꺼껄껍껀'만 교정할지 묻습니다.

y는 모두를 n은 '께'만 빼고 교정합니다. 'y','n'를 입력합니다.

95%는 올바른 교체이고 나머지 5%가 잘못된 교정일 때 

올바르게 교정됐는지 확인용, 교정전 자막이  '-께꺼껄껍껀 수정전.txt'에 저장하고 완료되면 메세지 창을 띄웁니다.


notepad++ 질문과 완료 메세지는 한글이 깨져서 구글 번역 영문 메세지입니다.

파일은 아래 링크에 자막을 첨부했습니다.

누락된자막 찾아내는 것은 별도 실행파일(드래그앤드롭 불가)과 notepad++스크립트용 두 종류가 있고 나머지는 notepad++스크립트용만 있습니다.

실행파일은 바이러스 오진있으면 notepad++스크립트용을 사용하시면 됩니다.

탐색기 상단에 '경로복사' 버튼으로 경로를 복사할 수 있습니다.


https://cineaste.co.kr/bbs/board.php?bo_table=psd_caption&wr_id=1866935 

Facebook Twitter GooglePlus KakaoStory NaverBand 신고
 
3 Comments
21 장곡  
대단하십니다. 이런 것은 웬만한 사람은 절대 모르는 것같습니다.
41 백마  
자료 감사합니다^^
오 저도 notepad++ 사용하는데.. 그냥 메모장으로 ㅋㅋ