섭타이틀에디트, "오디오를 텍스트로" (wispher) 테스트 짤막 후기
섭타이틀에디트의 "오디오를 텍스트로" 기능을 단편 몇 편을 놓고 테스트해봄.
영문 자막이 없다면 써볼 만함.
- 프로그램 기능에 vosk와 whisper 두 가지가 있는데 whisper가 월등히 나음.
- whisper가 언어 선택 폭도 넓음.
- 언어를 선택한 다음 모델을 선택해야 하는데 시험해보니 small(488M) 모델이 가장 정확한 듯,
(고용량 모델은 전력과 시간만 많이 잡아먹고 결과는 신통치 않음)
- 싱크가 정확히 찍히지는 않는다.
- 포기하고 있던 애니 세 편과 영화 두 편 자막을 건짐,
(매딘 형님과 만디코 씨, 흐흐)
- 불어도 품질이 좋은 편
- 우리말은 품질이 그다지 좋지 않음
(발음과 음질이 무난한 유투브 영상으로 시험해봄)
- 번역 기능도 있음.
영어 음질과 발음이 무난한 영상이라면 써먹어 봐도 좋아요.
저는 영국식 이상한 발음에 배경음도 깔린 영상에도 적용해봤는데 나름 괜찮았어요.
5 Comments
녹음 상태가 안 좋으면 효과가 별로일지 궁금합니다.

음성을 텍스트로 바꾸는 건... 네이버에서 운영하는 클로바노트를 써도 나름 준수하게 뽑아주고 srt로도 뽑을 수 있습니다...
https://clovanote.naver.com/home
https://clovanote.naver.com/home
Harrum님 덕분에 Whisper 기능이 Subtitle Edit에 구현된 걸 알아서 써보고 있었는데, CPU만 사용해서 속도가 너무 느려서 힘들었는데
3.6.12에서 GPU를 Whisper에서 쓸 수 있게 기능이 추가되어 속도가 엄청나게 빨라졌습니다. 2시간 54분짜리 일본어 파일을 5분도 안 돼서 텍스트로 만들어주네요.
1. 사용법은 https://github.com/SubtitleEdit/subtitleedit/issues/6651 에서 niksedk가 설명한 대로 하시면 ConstMe 모델이 다운로드 되고 우측 위가 ConstMe로 바뀝니다.
2. 라인별 변환은 일단 전체 변환이 된 후 문제가 있는 라인들 선택 후 오른쪽 마우스 -> 선택한 줄 -> 오디오 -> 오디오를 텍스트로 옵션 중 선택해서 사용하시면 됩니다.
3.6.12에서 GPU를 Whisper에서 쓸 수 있게 기능이 추가되어 속도가 엄청나게 빨라졌습니다. 2시간 54분짜리 일본어 파일을 5분도 안 돼서 텍스트로 만들어주네요.
1. 사용법은 https://github.com/SubtitleEdit/subtitleedit/issues/6651 에서 niksedk가 설명한 대로 하시면 ConstMe 모델이 다운로드 되고 우측 위가 ConstMe로 바뀝니다.
2. 라인별 변환은 일단 전체 변환이 된 후 문제가 있는 라인들 선택 후 오른쪽 마우스 -> 선택한 줄 -> 오디오 -> 오디오를 텍스트로 옵션 중 선택해서 사용하시면 됩니다.