섭타이틀에디트, "오디오를 텍스트로" (wispher) 테스트 짤막 후기

자막제작자포럼

섭타이틀에디트, "오디오를 텍스트로" (wispher) 테스트 짤막 후기

14 Harrum 5 585 1


섭타이틀에디트의 "오디오를 텍스트로" 기능을 단편 몇 편을 놓고 테스트해봄.

영문 자막이 없다면 써볼 만함.


- 프로그램 기능에 vosk와 whisper 두 가지가 있는데 whisper가 월등히 나음.

- whisper가 언어 선택 폭도 넓음.

- 언어를 선택한 다음 모델을 선택해야 하는데 시험해보니 small(488M) 모델이 가장 정확한 듯,

   (고용량 모델은 전력과 시간만 많이 잡아먹고 결과는 신통치 않음) 

- 싱크가 정확히 찍히지는 않는다.

- 포기하고 있던 애니 세 편과 영화 두 편 자막을 건짐,

   (매딘 형님과 만디코 씨, 흐흐)

- 불어도 품질이 좋은 편

- 우리말은 품질이 그다지 좋지 않음

   (발음과 음질이 무난한 유투브 영상으로 시험해봄)

- 번역 기능도 있음.


영어 음질과 발음이 무난한 영상이라면 써먹어 봐도 좋아요.

저는 영국식 이상한 발음에 배경음도 깔린 영상에도 적용해봤는데 나름 괜찮았어요.

Facebook Twitter GooglePlus KakaoStory NaverBand 신고
5 Comments
12 Lowchain232  
녹음 상태가 안 좋으면 효과가 별로일지 궁금합니다.
14 Harrum  
한번은 정각장애인용 자막처럼 [voice]만 잔뜩 떴습니다. 흐흐

영상에서 필요한 부분만 mkvtoolnix-gui 같은 프로그램으로 자른 다음 테스트해보세요.
이 기능은 일부 구간만 적용할 수 없는 것 같아요.
6 동으로간다  
음성을 텍스트로 바꾸는 건... 네이버에서 운영하는 클로바노트를 써도 나름 준수하게 뽑아주고 srt로도 뽑을 수 있습니다...
https://clovanote.naver.com/home
4 E240  
Harrum님 덕분에 Whisper 기능이 Subtitle Edit에 구현된 걸 알아서 써보고 있었는데, CPU만 사용해서 속도가 너무 느려서 힘들었는데
3.6.12에서 GPU를 Whisper에서 쓸 수 있게 기능이 추가되어 속도가 엄청나게 빨라졌습니다. 2시간 54분짜리 일본어 파일을 5분도 안 돼서 텍스트로 만들어주네요.
1. 사용법은 https://github.com/SubtitleEdit/subtitleedit/issues/6651 에서 niksedk가 설명한 대로 하시면 ConstMe 모델이 다운로드 되고 우측 위가 ConstMe로 바뀝니다.
2. 라인별 변환은 일단 전체 변환이 된 후 문제가 있는 라인들 선택 후 오른쪽 마우스 -> 선택한 줄 -> 오디오 -> 오디오를 텍스트로 옵션 중 선택해서 사용하시면 됩니다.
14 Harrum  
cpu만 사용해서 느렸군요. 엄청 소음도 심했거든요.
한번 해봐야겠습니다. 고맙습니다!! ^^