구글, AI 포럼 ‘AI 혁신과 자연어 처리’ 개최

[테크월드=양대규 기자] AI 혁신으로 ‘5년 이내에 사람과 기계가 효과적으로 대화가 가능할 것’으로 기대된다. 구글은 언어 데이터가 많지 않더라도 ‘신경망 모델’을 통해, AI가 일반적인 대화를 이해하고 처리하는 기술이 더욱 빨리 발전할 수 있다고 말한다. 기술의 핵심은 이를 적재적소에 적용하는 알고리즘(Algorithm) 개발에 있다.

◇ ”기계를 통해 범접할 수 있는 영역 남아있어”

구글 전산언어학 팀을 이끌고 있는 하다 셈토브(Hadar Shemtov) 리서치팀 디렉터는 ‘사람과 대화하듯 자연스러운 문답을 주고받는 시기가 언제 올 것인가’라는 질문에 “절대로 기계를 통해서 범접할 수 있는 영역이 남아있다”며 “그럼에도 알고리즘 개발 등을 통해 구글은 음성의 질을 개발하기 위해 노력하고 있다. 이런 것이 누적했을 때 완전한 인간처럼 될 수는 없더라도 5년 이내에 효과적으로 사람과 기계 사이에 대화가 가능할 것”이라고 답했다.

구글은 인간과 기계 사이의 대화를 위해, 꾸준히 자연어 처리(Natural Language Processing, NPL) 연구를 진행 중이다. NPL은 컴퓨터와 인간 자연어의 상호작용, 특히 대량의 자연어 말뭉치를 처리와 관련한 컴퓨터 공학·AI·전산언어학의 융합 분야다. 구글의 연구팀이 NPL 주제로 게재한 연구 논문만 370건에 달한다.

구글은 다수의 언어와 도메인 등을 적재적소에 바로 적용할 수 있는 알고리즘 개발에 초점을 두고 NPL 연구를 진행 중이다. 알고리즘은 구글 제품과 서비스 전체에서 다양한 방식으로 활용되며, 검색·모바일·앱·광고·번역 등의 사용자 환경 개선에 도움을 주고 있다.

대표적으로 스마트폰과 스피커에 이용되는 음성인식 AI 비서 ‘구글 어시스턴트’에 NPL 기술을 적용하고 있다. NPL 기술을 통해 어시스턴트는 전체 문장을 듣고 문맥을 이해하며, 사용자의 질문에 적절한 답변을 제시한다. 이밖에도 구글 알로, 구글 번역, 유튜브 자동 자막, 안드로이드 앱 리뷰 분석 등에 NPL 기술이 쓰인다.

하다 셈토브 리서치팀 디렉터(왼쪽)와 최현정 연구원(오른쪽)

'AI 혁신과 자연어 처리'라는 주제로 12월 5일 열린 '구글 AI포럼'에서 구글은 확장성을 중시하고 범언어적 시스템을 만드는 게 목적이라며, 모든 언어를 한 언어처럼 생각해보자는 방향으로 연구하고 있다고 설명했다. 이런 구글의 연구에는 한국어도 포함된다. 구글 전산 언어학자 팀의 리드인 최현정 연구원이 한국어 NPL 연구를 통해 구글 어시스턴트의 신경 언어학 프로그램에 주력하고 있다.

포럼에서 발표를 맡은 최현정 연구원은 “한국어는 구어와 문어의 차이가 커서 수집되는 데이터가 다르다. 타이핑으로 검색을 하는 것과 말하는 것의 차이가 큰 언어다. 말하는 사람과 듣는 사람의 관계에 따라서도 데이터가 다르다. 상황에 따라 상하관계 규명이 어렵다. 또한, 한국어 구어에서는 운율적인 요소가 많이 들어간다”며, 처리해야 되는 데이터의 종류가 많아 NPL 연구가 어려운 분야 중 하나라고 설명했다.

예를 들어, “김 과장에게 고맙다고 전해줘”라는 문장의 경우, 말하는 사람이 김 과장과 직책의 상하 관계에 따라 전달하는 말의 내용이 달라진다. ‘안녕’이라는 단순한 인사에서도 이것 ‘만남’인지 ‘헤어짐’인지가 달라진다. 

구글은 네이버, 카카오, 삼성 등 국내 업체와 비교해 한국어 데이터의 수가 부족하다는 지적도 나온다. 이에 최현정 연구원은 “신경망 모델로 넘어가면서 데이터가 적어도 좋은 퍼포먼스를 보일 수 있다”며, 효율적인 알고리즘 개발로 문제를 해결할 수 있다고 답했다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지