티스토리 뷰

뉴스

구글 번역기, 자신만의 언어 형성에 다가서다

알 수 없는 사용자 2016. 11. 25. 01:03

언어란 내가 가진 생각을 표현해 주는 도구로서 그 의미를 가집니다. 이러한 언어의 특성 덕분에 누구나 한번쯤은 영어 공부를 하며 내 생각을 있는 그대로 번역해주는 번역기가 있었으면 하고 생각을 해본 경험이 있을 것입니다. 이와 비슷하게 컴퓨터가 자신만의 생각을 가지고 자체 언어를 만들어낸다면 어떨까요? 구글 AI 연구자들이 이러한 관점에 한층 더 가까워진 연구 결과를 가져왔습니다. 그들은 인공 신경망을 이용한 구글 번역기 시스템에서 마치 사람의 생각을 그대로 전달하듯, 언어의 장벽을 없애버릴 수 있는 실용적인 언어에 대한 실마리를 밝혀냈습니다.



구글은 이미 9월에 인공 신경망을 이용한 기계 번역 시스템(Google Neural Machine Translation System; GNMT)을 번역기 시스템에 도입했다고 밝혔습니다. 덕분에 구글 번역기는 딥 러닝을 이용하여 언어 간 더욱 자연스러운 번역을 이끌어 내었습니다


이러한 성공에 이어 구글 번역기 개발자들은 또 다른 호기심이 생겼습니다. 번역 시스템에 영어/한국어 사이의 번역을 가르치고, 다시 영어/일본어 사이 번역을 가르친다면, 보통 영어를 징검다리로 한국어/일본어 사이의 번역이 가능합니다. 하지만 구글에서는 굳이 영어를 징검다리로 사용하지 않고도 한국어/일본어 사이의 번역할 수 있을 것이라고 생각했습니다. 결론적으로, 구글 번역기 개발자들은 이것이 가능하다는 것을 밝혀냈습니다. 다시 말해 언어를 번역하는 데 있어 세 언어 사이 직접적인 번역 과정을 학습시키지 않고도 직접적인 연결고리가 없는 두 언어를 번역할 수 있는 것입니다. 그 과정은 아래 그림에서 확인할 수 있습니다.



일명 제로-샷 번역(zero-shot translation)이라고 부르는 이 아이디어는 두 언어 간 합리적이고 합당한 번역을 만들어 내지만 그 둘 사이 번역 결과가 직접적으로 연결되어 있지 않습니다두 번역 사이에 인공 신경망을 사용한 구글 번역기 시스템만이 알 수 있는 언어로 이해를 한 후 나머지 언어로 번역합니다.

 

제로 샷 번역의 아이디어에 더 나아가 구글 번역기 개발자들은 새로운 개념을 생각합니다. 만약 직접적인 연결고리가 없는 두 언어에 대해 번역했다면, 구글 번역기 내에 자체 언어가 있을 것이라 생각한 것입니다. 만약 컴퓨터가 서로 다른 언어로 이루어진 두 가지 단어를 번역해 낸다면, 그 방식은 두 가지가 있을 것입니다.


첫째로 그 컴퓨터가 특정 단어에 대해 공유된 개념을 형성하여 단어를 번역해내는 방법이 있습니다. 두 번째는 두 언어 문구 사이의 일대일 연결을 통해  만들어 낼 수도 있습니다. 구문을 정확히 이해하고 그 둘 사이 연결을 만들어 낸 것인지, 아니면 run – 달리다 와 같은 공식의 개념으로 접근하여 그 번역을 해내었는지에 대한 것은 분명한 차이가 존재합니다. 그리고 이번 구글 번역기의 제로 샷 번역은 인공 신경망 도입 및 개발을 통해 두 단어에 대해 공유된 개념을 형성하였고, 구글 번역기가 중간 언어를 도입했다는 것을 암시합니다.



실제로 구글 번역기 시스템 개발자들이 쓴 다중 언어간 번역 논문을 살펴보면 그 이야기가 자세히 나와 있습니다. 이 논문에서는 다국어 모델에 대해 시각적으로 분석하였을 때 구글 번역기 시스템이 번역 과정을 거치면서 자신만의 자체 언어, 즉 여러 언어들 사이 중간 언어를 학습하고 있다고 소개합니다.


인공 신경망을 이용한 구글 번역기가 다른 언어 간 변환에 사용하는 개념을 나타내기 위해 자체 신경망 안에서 자체 언어를 개발했다고 말하는 것은 아직 시기상조일 것입니다. 분명 제로샷 번역이 그 개념에 좀 더 가까이 갈 수 있도록 도와주었지만, 아직 시각적인 형태로 그 자체 언어의 형태를 지레짐작만 할 수 있기 때문입니다. 하지만 그 중간 언어가 어떻게 생겼든 간에 구글 번역기가 자신만의 언어를 가졌다는 그 사실만으로도 철학적으로 큰 이슈가 될 것입니다.


참고 기사

TechCrunch, "Google’s AI translation tool seems to have invented its own secret internal language"



에티 페이스북 페이지에서 에티의 다른 소식도 받아보세요


인기 포스팅 보기

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함