한글 자막용 OCR 공개
안녕하세요.
제가 개발한 자막용 OCR를 오픈소스로 공개했습니다.
(여기 글 참고 https://cineaste.co.kr/bbs/board.php?bo_table=psd_capmakef&wr_id=27926)
소스는 아래 링크에 있는 Github로 가시면 다운로드 받을 수 있습니다.
설치 및 사용법은 Github에 있으니 거길 참고해 주세요.
(소스뿐만 아니라 학습된 모델도 같이 다운로드 받아야 합니다.)
소스에서 사용한 다양한 라이브러리와 버전 문제 때문에 설치에 어려움을 겪을 수 있습니다.
16 Comments
인식률은 구글 비전api 와 비교해서 큰 차이가 나지 않는거 같습니다 다만 gpu 사용을 어떻게 하는지 몰라 그냥 cpu사용으로 해봤는데 시간이 너무 오래 걸리네요
120여줄의 10분 남짓한 동영상 변환하는데 30분 가까이 걸렸습니다 아마도 cpu사용해서 그런거 같습니다 진행중에 컴파일 제대로 하면 속도 더 빨라질 수 있다는? 워링도 뜨네요'Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2' 그나마 느린 cpu의 성능도 제대로 사용을 못한 거 같습니다
아마도 gpu쪽으로 하면 꽤 빨라질거 같기도 하지만 사용법을 몰라 안타깝네요 ㅋㅋ
프로그램 제작 수고하셨습니다 더군다나 오픈소스라니 굿입니다!
120여줄의 10분 남짓한 동영상 변환하는데 30분 가까이 걸렸습니다 아마도 cpu사용해서 그런거 같습니다 진행중에 컴파일 제대로 하면 속도 더 빨라질 수 있다는? 워링도 뜨네요'Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2' 그나마 느린 cpu의 성능도 제대로 사용을 못한 거 같습니다
아마도 gpu쪽으로 하면 꽤 빨라질거 같기도 하지만 사용법을 몰라 안타깝네요 ㅋㅋ
프로그램 제작 수고하셨습니다 더군다나 오픈소스라니 굿입니다!
Traceback <most recent call last>:
File "subocr.py", line 4, in <module>
from utils import *
File "C:\Users\SJJW\33\utils.py", line 5, in <module>
from PIL import image, imageDraw, ImageFont
ModuleNotFoundError: No module Named 'PIL'
python subocr.py -로 어떤 명령어 입력해도 저렇게 나오네요 ㅠㅠ
뭔가 제가 파이썬의 기초를 몰라서 생긴 오류일까요??
File "subocr.py", line 4, in <module>
from utils import *
File "C:\Users\SJJW\33\utils.py", line 5, in <module>
from PIL import image, imageDraw, ImageFont
ModuleNotFoundError: No module Named 'PIL'
python subocr.py -로 어떤 명령어 입력해도 저렇게 나오네요 ㅠㅠ
뭔가 제가 파이썬의 기초를 몰라서 생긴 오류일까요??
답변 감사하구 자꾸 번거롭게 물어봐서 죄송합니다..
말씀하신대로 Pillow 설치하고 명령어 입력하니 실행이 되고 조금 진행되다가
Traceback (most recent call last):
File "subocr.py", line 180, in <module>
main(args)
File "subocr.py", line 160, in main
detect_model = load_detect_model(args.d)
File "C:\Users\SJJW\33\utils.py", line 185, in load_detect_model
model.load_weights(model_path)
File "D:\python3.6\lib\site-packages\keras\engine\network.py", line 1166, in l
oad_weights
f, self.layers, reshape=reshape)
File "D:\python3.6\lib\site-packages\keras\engine\saving.py", line 1004, in lo
ad_weights_from_hdf5_group
original_keras_version = f.attrs['keras_version'].decode('utf8')
AttributeError: 'str' object has no attribute 'decode'
이렇게 다른 에러가 뜨네요 ㅠㅠ
말씀하신대로 Pillow 설치하고 명령어 입력하니 실행이 되고 조금 진행되다가
Traceback (most recent call last):
File "subocr.py", line 180, in <module>
main(args)
File "subocr.py", line 160, in main
detect_model = load_detect_model(args.d)
File "C:\Users\SJJW\33\utils.py", line 185, in load_detect_model
model.load_weights(model_path)
File "D:\python3.6\lib\site-packages\keras\engine\network.py", line 1166, in l
oad_weights
f, self.layers, reshape=reshape)
File "D:\python3.6\lib\site-packages\keras\engine\saving.py", line 1004, in lo
ad_weights_from_hdf5_group
original_keras_version = f.attrs['keras_version'].decode('utf8')
AttributeError: 'str' object has no attribute 'decode'
이렇게 다른 에러가 뜨네요 ㅠㅠ
keras 버전 2.2.4 맞구 weight.h5 파일 해당 디렉토리에 있습니당.. 혹시 몰라 학습모델 새로다운받아서 해봐두 결과는 같네요
명령어는 python subocr.py -i C:\Users\SJJW\11 -o sub.srt 이렇게 입력했습니다 11폴더에 VideoSubFinder에서 추출한 RGBImages 파일들 있구용
단일이미지 OCR도 해봤는데
Traceback (most recent call last):
File "ocr.py", line 139, in <module>
main(args)
File "ocr.py", line 125, in main
이부분만 위처럼 다르고 같은 에러가 나네요
해결책이 없을까용 후..
명령어는 python subocr.py -i C:\Users\SJJW\11 -o sub.srt 이렇게 입력했습니다 11폴더에 VideoSubFinder에서 추출한 RGBImages 파일들 있구용
단일이미지 OCR도 해봤는데
Traceback (most recent call last):
File "ocr.py", line 139, in <module>
main(args)
File "ocr.py", line 125, in main
이부분만 위처럼 다르고 같은 에러가 나네요
해결책이 없을까용 후..