인공지능 자막에 혀를 내두르며 1줄 씁니다
Ashel
49
2482
4
2020.01.13 03:50
잠긴글입니다.
49 Comments
인공지능 쪽에 관심이 있어서 여러 자료들 보다 보면 정말 발전 속도가 어마어마 하더군요
인간이 바둑으로 1번 이긴 알파고를 100:0으로 이긴 알파고 제로 그 알파고 제로를 뛰어넘은 다음 세대(이름 까묵음;;;)까지 이미 등장했죠
이미 의학쪽으로 침투돼있고 더 많은 일상생활과도 밀접하게 영향을 줄 기술들도 상용화 준비 중이고 지금과는 사람의 일하는 모습도 다양하게 바뀌겠죠
언제나 산업혁명 시기에는 혼란들이 존재하고 사라지는 직업 역시 존재하지만 새로 생겨나는 직업들도 존재하죠
밀려오는 파도에 맞서 버틸지 밀려오는 파도에 올라 탈지는 본인들의 선택이죠
전체적인 문맥을 파악하면 내용이 틀리진 않은 글인데
님이 쓴 몇몇단어와 글투가 사람들 신경에 거슬린건 같아요 물론 본인이 더 잘 알고있는것 같지만ㅎㅎ
인간이 바둑으로 1번 이긴 알파고를 100:0으로 이긴 알파고 제로 그 알파고 제로를 뛰어넘은 다음 세대(이름 까묵음;;;)까지 이미 등장했죠
이미 의학쪽으로 침투돼있고 더 많은 일상생활과도 밀접하게 영향을 줄 기술들도 상용화 준비 중이고 지금과는 사람의 일하는 모습도 다양하게 바뀌겠죠
언제나 산업혁명 시기에는 혼란들이 존재하고 사라지는 직업 역시 존재하지만 새로 생겨나는 직업들도 존재하죠
밀려오는 파도에 맞서 버틸지 밀려오는 파도에 올라 탈지는 본인들의 선택이죠
전체적인 문맥을 파악하면 내용이 틀리진 않은 글인데
님이 쓴 몇몇단어와 글투가 사람들 신경에 거슬린건 같아요 물론 본인이 더 잘 알고있는것 같지만ㅎㅎ
Best Comment
1. 이 정도면 1년쯤 뒤면 넷플렉스 같은 곳에서는 자막 제작 급여 낭비 따위 없이 모조리 자막 방송할 수 있다는 건데 (△)
=영어 기준으론 가능할 것 같습니다. 영어의 경우 전 세계 공용어로 취급될 만큼 많이 사용돼 학습을 위한 DB의 규모나 양이 방대하기 때문에 가능합니다.
한글 기준이라면 불가능할 것 같습니다. 지금 한글의 경우 평균 80% 정도의 정확도 보이고있으며. 사극의 경우 70%까지 떨어지고 있습니다¹
왜냐면 지금 음성인식기술을 사용하기 위한 학습 DB는 현대어 위주로 사용되어있어서 그렇습니다. 그렇기 때문에 시대별, 장르별 언어의 인식/생성을 위한 다양한 학습용 DB가 필요한 상황입니다.
지금 당장은 1년 안에 안 될지 몰라도 Ashel님께서 불철주야 DB 데이터를 입력하여 학습시켜주신다면 조금이나마 앞당겨지진않을까 생각합니다.
2. 하지만 2, 3년 후면 모든 자막의 품질이 일제히 90% 이상의 수준으로 올라갑니다. (X)
= Ai 번역이 얼마나 사람의 번역에 근접한 수준까지 다가왔는가를 나타내는 척도로 BLEU scale을 사용합니다. 20~30은 부자연스럽지만 어느 정도 의미전달이 가능한 수준, 30~40은 자연스러운 문장과 의미전달이 가능한 수준, 40 이상은 전문 번역가가 번역한 내용과 거의 일치한 경우를 의미합니다
그런데 아직 영어->한국어의 블루 스케일은 19.75로 20을 채 넘기지 못하고 있습니다 (영어-일본어 23.66, 영어->포르투갈어 38.40)²
스페인어, 프랑스어 등 다른 제2외국어에 비해 사용하는 사람의 수가 적어 DB의 양이 적고 문장구조의 차이와 복잡한 체계가 그 이유가 될 것 같네요.
물론 구글과 네이버에서 열심히 노력하고 있지만, 위에서도 언급했다시피 학습 DB는 현대어 위주로 사용되어있어 시대별, 장르별 번역은 아직 갈 길이 요원한 만큼 2-3년 안에 90%까진 힘들어 보입니다.
저 또한 인공지능의 대단함을 직접 경험하는 사람이기 때문에, 새로운 알고리즘이 개발되어 제가 위에서 적은 말들이 다 틀린 말이 되었으면 좋겠습니다.
p.s. 그러면서도 99% 이상이 대형마트를 가서 돈을 씁니다. (X)
= 한양대 유통연구센터 조사 결과 대형마트를 주로 이용한다고 답한 사람은 전체의 44%, 이용해본 적 있다고 응답한 사람은 전체의 80%입니다³
¹ 안충현, 장인선. (2016). 음성인식기술을 이용한 자막생성 연구. 한국방송미디어공학회 학술발표대회 논문집, (), 60-61.
² Johnson, Melvin, et al. "Google’s multilingual neural machine translation system: Enabling zero-shot translation." Transactions of the Association for Computational Linguistics 5 (2017): 339-351.
³ 오프라인, 대형마트 55% ‘1위’...온라인은 오픈마켓 64%, https://news.joins.com/article/22456154