subtitleedit 3.5.6 으로 sub 파일을 binary image compare 로 작업중에
유독 '애', '얘'', '내', '태' 등의 'ㅐ', 'ㅒ' 가 들어간 글자들은
'o' 은 숫작 '0' 으로 인식
'ㅌ' 은 영어 'E' 로 인식
'ㄴ' 은 영어 'I' (대문자 I) 또는 'L' 로 인식 합니다
subtitleedit OCR 방식의 편집에서 숫자 0 을 모두 제거해도 계속 숫자 0 으로 인식하는데
왜 이런현상이 생기는지 고수님들의 의견 부탁드립니다
참고로 맨 처음 OCR 시작시 '이미지 테이터베이스' 가 Latin 으로 되어있는데
그냥 이 상태에서 계속 OCR 작업을 했었습니다
OCR 메뉴의 편집에서 import 들어가서 기존DB(Latin) import 해서 불러 들이니 괜찮습니다
혹시 같은 궁금증 있으신분 참고하시라고 글 남깁니다
최신 버전은 인식률이 떨어지더라고요.
그리고 오류허용값을 0으로 놓고 변환하심 엉뚱한 문자로 변환되는 일은 없을 거예요.
넷플 추출 자막은 그런일이 없는데 유독 글자가 크게 되어있는 자막은 오류가 있어요 예로 '배" 자가 '내'로 인식하네요
DB를 새로 만들어 해보고 싶은데 그동안 해온게 있어 아까워서 못하네요
말씀하신 버전으로 DB 새로 만들고 해보겠습니다 고맙습니다