이미지 파일들에 포함된 한글 자막/텍스트를 OCR를 이용하여 추출한 다음 자막파일 또는 텍스트 파일로 저장해주는 라이브러리입니다.
- python 3.6x 또는 python 3.7x 버전대 설치
- 실행에 필요한 라이브러리 설치
pip install -r requirements.txt
- tensorflow 설치
CPU를 사용하는 경우
pip install tensorflow==1.13.1
또는 GPU를 사용하는 경우
pip install tensorflow-gpu==1.13.1
GPU를 사용하는 경우 CUDA 9.x 와 CUDNN이 먼저 설치되어 있어야 합니다.
학습된 모델을 아래 링크에서 다운로드 받아서 소스가 있는 디렉토리(model 디렉토리)에 압축을 풉니다. 경로가 아래의 옵션에 설정한 기본값과 다르다면 실행시 경로를 지정해 주어야 합니다.
멀티 이미지 OCR
python subocr.py -i imagepath -o outfile
파일명이 타임코드 형식이거나 타임코드 정보를 담고있는 html 파일이 존재하면 srt 자막으로 저장하고, 그렇지 않으면 일반 텍스트 파일로 저장합니다.
VideoSubFinder 프로그램을 이용하면 자막이미지 파일명이 타임코드 형식으로 저장됩니다. Subtitle Edit에서 sub/idx 파일을 자막이미지과 타임코드 정보를 가진 html 파일로 저장할 수 있습니다.
-d : 텍스트 검출 모델의 경로. 기본값은 "./model/craft/weight.h5"
-r : 텍스트 인식 모델 경로. 기본값은 "./model/aocr"
-i : 이미지 경로
-o : 출력 파일명. 기본값은 "sub.srt"
단일 이미지 OCR
python ocr.py -i imagefile
-d : 텍스트 검출 모델의 경로. 기본값은 "./model/craft/weight.h5"
-r : 텍스트 인식 모델 경로. 기본값은 "./model/aocr"
-i : 이미지 파일명
-o : OCR 인식결과 이미지 파일명. 값을 저장하지 않으면 OCR 이미지를 저장하지 않는다.
이미 학습된 모델말고 자신만의 데이터로 모델을 학습하고자 하는 경우 아래의 텍스트 검출 및 인식 소스를 다운로드 받아서 학습시키면 됩니다.