Ai에 대한 단상

자유게시판

Ai에 대한 단상

21 nonorhc 4 541 1

1. 음성인식은 말만하면 자막으로 뿅뿅 나오는 것이 아니라 음성의 파형을 양자화/부호화 과정을 거쳐 디지털화하고

그 정보를 가우시안 확률분포에 기반을 둔 철저한 확률통계 방식을 통하여 변환하는 과정입니다
거기에 수많은 결과를 학습하여 축적된 데이터를 통해 다음 내용을 미리 예측하는 딥러닝을 통해 정확도를 높여주고 있고요

(가령 '나는 밥을 먹는다'를 음성인식할때 '나는 밥을' 까지만 말한 상태라면, 다음에 나올 내용을 컴퓨터는 이전 문장과 이미 축적돼있는 데이터를 기반으로 '먹는다'가 나올 확률이 높다고 예측을 하고 준비를 합니다. 그리고 그 다음 나오는 '먹는다'의 실제 음성의 변환값과 비교하고 결과를 문자로 나타낸다고 보시면 됩니다. 마찬가지로 이 데이터는 다시 학습데이터로 사용이 됩니다.)


2. Ai번역은 요즘 대세인 RNN 방식의 경우 한 문장을 잘게 쪼개어 다대다 방식으로 병렬 번역하는데
축적된 데이터를 통해 쪼갠 번역결과물에 가중치(weight)를 부여하며 계속 재귀시키며 연산한뒤 가장 확률이 높은 문장을 꺼내보이는 방식입니다

 ¹
이 경우도 위에서 적은것과 같이 수많은 학습으로 축적된 데이터를 통해 문장을 예측하는 방식이라는 겁니다


3. 덧붙여 우리는 알게 모르게 Ai의 학습에 도움을 주고 있습니다.

가장 쉬운 예를 하나 들자면 구글 리캡챠로 소화전/신호등/자전거를 골라 제출함으로써, 우리는 구글에서 연구중인 자율주행차량에 쓰이는 데이터 학습을 도와주고 있습니다



3줄요약
인공지능을 통해 나타난 값은 인간이 사용한 수많은 데이터가 축적되어 만들어낸 경우의 수 중 가장 빈도와 확률이 높은 하나의 '예측값'이다

즉, Ai는 마술이 아닌 기술이고 판결(verdict)이 아닌 예측(predict)이다. 다만 인간이 예측값의 옳고 틀림을 계속하여 정해주고, 끊임없이 학습하기 때문에 정확도가 올라가는 것일 뿐

그렇다면 규칙과 경우의 수를 벗어나는 무한한 창작의 자유가 허용되는 문학/예술을 학습시킬 수 있을 것인가?



p.s.
결국 사람이 행한 데이터를 기반으로 학습하는 Ai의 특성상 헛점은 존재합니다. 그렇지않고서야 이세돌이 어떻게 알파고를 이겼겠습니까?
그리고 당장 기생충만 봐도 외국인들이 공감하고 영화가 인정받는 이유중 하나로 외국인들이 잘 이해할 수 있는 영문자막이 꼽히고 있는데
서울대와 짜빠구리를 잘 모르는 외국인들을 위해 서울대를 Oxford로 바꾼다던가 짜빠구리를 Ram-don으로 바꾸는 이런 초월번역은 사람이 아니라면 절대 할 수 없는 번역입니다 



¹http://naviglinlp.blogspot.com/2018/06/lecture-26-neural-machine-translation.html

Facebook Twitter GooglePlus KakaoStory NaverBand 신고
 
4 Comments
13 스눞  
최근 자유게시판을 뜨겁게 달구고 있는 음성 인식 및 인공지능 번역에 대한 글들 흥미롭게 읽었습니다.
그중에서도 nono 님 글을 제일 눈여겨 보았는데 그런 사람이 저뿐은 아닐 것 같습니다.
귀한 글 귀한 관점과 정보 감사합니다!
^_^

여담으로 몇 마디 적자면, 저는 인공지능이 이(와 같은 성격의) 문장을 제대로 번역하는 날이 오면
인공지능 번역 자막으로 영화를 보려고 합니다. ㅋ

전문 번역가들이 번역기를 테스트하는 몇 가지 리트머스 시험지(문장 및 표현)가 있는데
그중 하나가 (비아냥거리는 어투의) '똥을 싸고 있네'라는 문장(황석희 번역가 페이스북에서 읽었습니다 ㅎㅎ)이라고 하더군요.
파파고 번역기에 '똥을 사고 있네'를 입력하면 'He's taking a shit', 구글 번역기에서는 'Wrapping shit'이라는 영어 문장을 뱉어냅니다.

저는 민해서 다른 건 잘 모르겠고, 얼른 훌륭한 번역기가 보급돼서
봉준호 감독이 골든글로브 시상식에서 지적한 '1인치 자막의 장벽'을 허물고
마음껏 세계의 다양한 영화를 볼 수 있는 날이 어서 오기를 고대하고 있습니다.
^_^
21 nonorhc  
열렬한 이용자이자 허접한 제공자인 저 또한 이전 댓글에서 적었다시피 영어가 아닌 다른 자막/음성이 사용되는 전혀 생소한 영화도
고품질의 기계번역자막으로 볼 수 있는 날이 빨리 왔으면 좋겠다고 생각합니다 ^^;;
16 o지온o  
자막이란 것이 참.. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
AI를 굳이 내세우지 않더라도
사람과 사람 사이의 대화를 제대로 알아듣는다는 것은 사람으로서도 굉장히 어려운 일이겠죠.
게다가 인간의 삶에 있어서 끊임없이 [신조어]라는 것이 생겨나고 있고..
이 [신조어]란 것은 특정 시대, 특정 시간에서만 통용되는 것일 경우가 많고..
이런 모든 것을 자동 번역으로 감정까지 전달해 줄 수 있는 AI가 어서 나왔으면 좋겠다는 바람은
누구나 있으리라 생각합니다.
21 nonorhc  
Ai는 결국 데이터가 쌓여야 학습이 가능하기 때문에
언어와 예술처럼 시시각각 변하는 트렌드에 대응하는 것이 절대 쉽지 않습니다