질문과답변

subtitleedit 에서 ocr 중 궁금증이요

S 여보밥줘 5 343

subtitleedit 3.5.6 으로 sub 파일을 binary image compare 로 작업중에

유독 '애', '얘'', '내', '태' 등의 'ㅐ', 'ㅒ' 가 들어간 글자들은

'o' 은 숫작 '0' 으로 인식

'ㅌ' 은 영어 'E' 로 인식

'ㄴ' 은 영어 'I' (대문자 I) 또는 'L' 로 인식 합니다

 

subtitleedit OCR 방식의 편집에서 숫자 0 을 모두 제거해도 계속 숫자 0 으로 인식하는데 

왜 이런현상이 생기는지 고수님들의 의견 부탁드립니다

 

참고로 맨 처음 OCR 시작시 '이미지 테이터베이스' 가 Latin 으로 되어있는데

그냥 이 상태에서 계속 OCR 작업을 했었습니다

  • 페이스북으로 보내기
  • 트위터로 보내기
  • 구글플러스로 보내기
  • 카카오스토리로 보내기
  • 네이버밴드로 보내기
  • 네이버로 보내기
  • 텀블러로 보내기
  • 핀터레스트로 보내기

Author

Lv.20 S 여보밥줘  supporter(9등급)
71,526 (18.2%)

등록된 서명이 없습니다.

Comments

S 여보밥줘
하... DB 를 새로 만들어서 하니 괜찮네요. 기존 꺼 날려야 하는지 알고 뜨끔 했습니다
OCR 메뉴의 편집에서 import 들어가서 기존DB(Latin) import 해서 불러 들이니 괜찮습니다
혹시 같은 궁금증 있으신분 참고하시라고 글 남깁니다
24 cliche
3.5.4 버전으로 변환하세요.
최신 버전은 인식률이 떨어지더라고요.
그리고 오류허용값을 0으로 놓고 변환하심 엉뚱한 문자로 변환되는 일은 없을 거예요.
S 여보밥줘
지금 3.5.6 버전 사용중인데요 오류 허용값을 0으로 해도 어느 SUB 자막은 인식 오류가 있어요
넷플 추출 자막은 그런일이 없는데 유독 글자가 크게 되어있는 자막은 오류가 있어요 예로 '배" 자가 '내'로 인식하네요
DB를 새로 만들어 해보고 싶은데 그동안 해온게 있어 아까워서 못하네요
말씀하신 버전으로 DB 새로 만들고 해보겠습니다 고맙습니다
21 전치
댓글내용 확인
S 여보밥줘
처음에 모르고 Latin.db 를 사용 했는데 전치님 말씀대로 폰트별로 db만들어 사용하면 좋을것 같네요. 답변 고맙습니다.