인공지능 자막에 혀를 내두르며 1줄 씁니다

자유게시판

인공지능 자막에 혀를 내두르며 1줄 씁니다

8 Ashel 49 2482 4

잠긴글입니다.

Facebook Twitter GooglePlus KakaoStory NaverBand 신고
 

Best Comment

BEST 1 S nonorhc  
인공지능에 대해 잘못 이해하고 계시는 것 같아 짧게 적어봅니다

1. 이 정도면 1년쯤 뒤면 넷플렉스 같은 곳에서는 자막 제작 급여 낭비 따위 없이 모조리 자막 방송할 수 있다는 건데 (△)
=영어 기준으론 가능할 것 같습니다. 영어의 경우 전 세계 공용어로 취급될 만큼 많이 사용돼 학습을 위한 DB의 규모나 양이 방대하기 때문에 가능합니다.
한글 기준이라면 불가능할 것 같습니다. 지금 한글의 경우 평균 80% 정도의 정확도 보이고있으며. 사극의 경우 70%까지 떨어지고 있습니다¹
왜냐면 지금 음성인식기술을 사용하기 위한 학습 DB는 현대어 위주로 사용되어있어서 그렇습니다. 그렇기 때문에 시대별, 장르별 언어의 인식/생성을 위한 다양한 학습용 DB가 필요한 상황입니다.
지금 당장은 1년 안에 안 될지 몰라도 Ashel님께서 불철주야 DB 데이터를 입력하여 학습시켜주신다면 조금이나마 앞당겨지진않을까 생각합니다.

2. 하지만 2, 3년 후면 모든 자막의 품질이 일제히 90% 이상의 수준으로 올라갑니다. (X)
= Ai 번역이 얼마나 사람의 번역에 근접한 수준까지 다가왔는가를 나타내는 척도로 BLEU scale을 사용합니다. 20~30은 부자연스럽지만 어느 정도 의미전달이 가능한 수준, 30~40은 자연스러운 문장과 의미전달이 가능한 수준, 40 이상은 전문 번역가가 번역한 내용과 거의 일치한 경우를 의미합니다
그런데 아직 영어->한국어의 블루 스케일은 19.75로 20을 채 넘기지 못하고 있습니다 (영어-일본어 23.66, 영어->포르투갈어 38.40)²
스페인어, 프랑스어 등 다른 제2외국어에 비해 사용하는 사람의 수가 적어 DB의 양이 적고 문장구조의 차이와 복잡한 체계가 그 이유가 될 것 같네요.
물론 구글과 네이버에서 열심히 노력하고 있지만, 위에서도 언급했다시피 학습 DB는 현대어 위주로 사용되어있어 시대별, 장르별 번역은 아직 갈 길이 요원한 만큼 2-3년 안에 90%까진 힘들어 보입니다.


저 또한 인공지능의 대단함을 직접 경험하는 사람이기 때문에, 새로운 알고리즘이 개발되어 제가 위에서 적은 말들이 다 틀린 말이 되었으면 좋겠습니다.

p.s. 그러면서도 99% 이상이 대형마트를 가서 돈을 씁니다. (X)
 = 한양대 유통연구센터 조사 결과 대형마트를 주로 이용한다고 답한 사람은 전체의 44%, 이용해본 적 있다고 응답한 사람은 전체의 80%입니다³

¹ 안충현, 장인선. (2016). 음성인식기술을 이용한 자막생성 연구. 한국방송미디어공학회 학술발표대회 논문집, (), 60-61.
² Johnson, Melvin, et al. "Google’s multilingual neural machine translation system: Enabling zero-shot translation." Transactions of the Association for Computational Linguistics 5 (2017): 339-351.
³ 오프라인, 대형마트 55% ‘1위’...온라인은 오픈마켓 64%, https://news.joins.com/article/22456154
49 Comments
8 Ashel  
못알아듣는 사람 억지로 끌고 가고 싶은 젊은 사람 아닙니다. 그러니 어리광 그만 부리십시오.
더 공부하시고 맥락이 이어지면 그때,
아니 그런 때는 안 올거 같은 사람 같으니 그만 둡시다.
15 Harrum  
동문서답하지 마시고.
내가 인공AI 기술에 대해 의견내지 않았죠?
단지 인간 노동이 낭비라는 님의 의견에 대해 글을 남긴 것입니다.
그런데 생뚱하게 진화니, 유희니, 지적 수준이니 엉뚱한 말로 감정 표출하니까 계속 질문하는 겁니다.
1 RiderJun  
말씀하신대로 90%수준의 품질은 유지가 될수 있지만 여전히 사람들은 120%의 품질을 가진 인간의 감성에 집착하게 될것입니다
8 Ashel  
프렌차이즈 식당등도 번성하고 아직 맛집은 아직까지 존재는 합니다. 하지만 앞으로도 그럴지는 모르겠군요.
1 djnfjus  
자막과는 좀 다르지만 인공지능이 쓴 소설 읽어 봤는데 사람과 구분이 잘 안 돼요
인공지능도 글에 감성을 넣을 수 있더라고요 감성도 결국 학습이니깐요
1 RiderJun  
또한 자막은 단순한 의미 전달이 아닙니다. 말씀하신 내용대로라면 다큐에서는 좋은 자막이 나올지 모르지만 영화에서는 각 캐릭터의 어투, 어법을 무시함으로써 캐릭터의 개성을 뭉개버리는 최악의 자막이 나올것 같군요
8 Ashel  
인공지능이 인간의 감성을 인간들보다 더 잘 알아서 챙겨줄 때도 고집스럽게 그 용기를 간직하시길 바라겠습니다.
15 Harrum  
기술발전에 있어 인간의 노동은 늘 낭비였습니까?
경제가 기술만으로 굴러갑니까?
논거도 없이 현대사회에 있어 노동과 직업이 유희라고 하면 이게 진실인가요?
많이 배운 분이 대답해보시죠.
1 djnfjus  
인공지능 쪽에 관심이 있어서 여러 자료들 보다 보면 정말 발전 속도가 어마어마 하더군요
인간이 바둑으로 1번 이긴 알파고를 100:0으로 이긴 알파고 제로 그 알파고 제로를 뛰어넘은 다음 세대(이름 까묵음;;;)까지 이미 등장했죠
이미 의학쪽으로 침투돼있고 더 많은 일상생활과도 밀접하게 영향을 줄 기술들도 상용화 준비 중이고 지금과는 사람의 일하는 모습도 다양하게 바뀌겠죠
언제나 산업혁명 시기에는 혼란들이 존재하고 사라지는 직업 역시 존재하지만 새로 생겨나는 직업들도 존재하죠
밀려오는 파도에 맞서 버틸지 밀려오는 파도에 올라 탈지는 본인들의 선택이죠

전체적인 문맥을 파악하면 내용이 틀리진 않은 글인데
님이 쓴 몇몇단어와 글투가 사람들 신경에 거슬린건 같아요 물론 본인이 더 잘 알고있는것 같지만ㅎㅎ
1 꼬꼬또또  
전형적인 꼰대 마인드를 가진 사람의 글.
어쭙잖은 지식수준으로 장황한거까진 그렇다쳐도, 아몰라 니들은 틀리고 내말만 맞아,뽹!!!!!~~~~~~~
하는 모습이 볼썽사납네요.인성 먼저 갖추고 글쓰시길
8 Ashel  
꼰대 마인드가 뭔지는 구별은 하고 쓴 대글일까?
이 양반 시네스트 번역 가지고 분탕질 하던 사람인데
이제는 이런 글로 은근슬쩍 돌려까기 하고 있네.
이 정도면 운영자님이 제재를 해야 하는게 아닌지요.
인공지능 자막에 혀를 내둘리기 전에 글 쓸 때 함부로 혀를 놀리지 마시길... 적어도 인간 지능이라면 게시판 매너 좀 지키시길.
8 Ashel  
정도껏 해야지 싶겠지. 뭐가 자존심이 뭔지도 모르시겠지만.
손가락질을 제대로 하면서 내게 욕을 하면 기꺼워 좋아죽을 거라는 것도 좀 아시길. 제발.
1 lupino  
자신이 무슨 소크라테스인줄 아시는... 그저 애잔하네요 ㅠㅠ
8 Ashel  
무지에 대한 대처는 노자지 소크라테스 방식이 아님. 알아 듣지 못하겠지만.
1 시안  
무슨 자막을 본건지 좀 궁금하네요.
가장 성능좋은 번역기라면 구글번역이고 국내한정으로는 파파고도 괜찮은데요. 구글이 알파고를 통해 자신들의 머신러닝 기술력을 과시한 이후 현재 바둑관련 프로젝트는 사실상 접었구요. 본격적으로 머신러닝을 이용해서 꾸준히 투자하고 있는게 구글번역입니다. 유툽의 자동번역도 머신러닝 기술이 접목된거구요. 유툽이 구글에 인수된건 아실테고, 구글이 어떤 회사인지야 굳이 설명할 필요는 없을거고... 그런데 구글번역이나 유툽자동번역도 아직 한참 부족해요..
8 Ashel  
영어자막입니다. 라이브 생중계를 영어 문장으로 보여주는 기술이었습니다.
어떤 분께서도 뭔지 궁금하시다 쪽지를 주셔서 그분만 그러신줄 알아 그분에게만 쪽지로 답을 드렸었는데,
제 표현이 잘못된건지 번역 자막이라고 알아들으시는 분이 또 계시네요.
1 시안  
어떤 영상인지 어떤 자막인지 좀 알 수 있을까요? 쪽지도 괜찮구요.
1 choobaka  
"인공지능이 해설을 자막으로 처리해서 보여주는데..."
이건 그냥 음성인식 기능 아닌가요??
인공지능 전에도 유사한 기술이 있었고
인공지능의 놀라운 점이라고 볼 정도는 아닌데...