subtitleedit 에서 ocr 중 궁금증이요

30 여보밥줘 기타 5 1,795 2018.05.09 10:44

subtitleedit 3.5.6 으로 sub 파일을 binary image compare 로 작업중에

유독 '애', '얘'', '내', '태' 등의 'ㅐ', 'ㅒ' 가 들어간 글자들은

'o' 은 숫작 '0' 으로 인식

'ㅌ' 은 영어 'E' 로 인식

'ㄴ' 은 영어 'I' (대문자 I) 또는 'L' 로 인식 합니다

subtitleedit OCR 방식의 편집에서 숫자 0 을 모두 제거해도 계속 숫자 0 으로 인식하는데

왜 이런현상이 생기는지 고수님들의 의견 부탁드립니다

참고로 맨 처음 OCR 시작시 '이미지 테이터베이스' 가 Latin 으로 되어있는데

그냥 이 상태에서 계속 OCR 작업을 했었습니다

좋아요
멋져요
기뻐요
슬퍼요
힘내요

느낌

OCR

Author

Lv.30 30 여보밥줘 프렌드(5등급)

등록된 서명이 없습니다.

+5 05.09 subtitleedit 에서 ocr 중 궁금증이요

+
커뮤니티인기글

+26 19시간전 저작권 고소 불송치 됐습니다

+10 1일전 자막 다운 받으러 왓더니

+18 1일전 아들만 셋인데 경영권 분쟁 없는 한화 그룹

+11 2일전 빼앗기는 것과 나누는 것

+11 2일전 소장 영화 드라마들을 x265 HEVC로 교채할까 고민 중인데

+3 2일전 타란티노 소식

Previous Next

Comments

30 여보밥줘 2018.05.09 11:17

하... DB 를 새로 만들어서 하니 괜찮네요. 기존 꺼 날려야 하는지 알고 뜨끔 했습니다
OCR 메뉴의 편집에서 import 들어가서 기존DB(Latin) import 해서 불러 들이니 괜찮습니다
혹시 같은 궁금증 있으신분 참고하시라고 글 남깁니다

25 cliche 2018.05.23 14:44

3.5.4 버전으로 변환하세요.
최신 버전은 인식률이 떨어지더라고요.
그리고 오류허용값을 0으로 놓고 변환하심 엉뚱한 문자로 변환되는 일은 없을 거예요.

30 여보밥줘 2018.05.25 10:11

지금 3.5.6 버전 사용중인데요 오류 허용값을 0으로 해도 어느 SUB 자막은 인식 오류가 있어요
넷플 추출 자막은 그런일이 없는데 유독 글자가 크게 되어있는 자막은 오류가 있어요 예로 '배" 자가 '내'로 인식하네요
DB를 새로 만들어 해보고 싶은데 그동안 해온게 있어 아까워서 못하네요
말씀하신 버전으로 DB 새로 만들고 해보겠습니다 고맙습니다

24 전치 2018.05.25 23:31

댓글내용 확인

30 여보밥줘 2018.05.26 00:01

처음에 모르고 Latin.db 를 사용 했는데 전치님 말씀대로 폰트별로 db만들어 사용하면 좋을것 같네요. 답변 고맙습니다.

로그인한 회원만 댓글 등록이 가능합니다.

이전 다음 목록