기계학습으로 숙성되는 인공지능

머신러닝과 HPC(High Performance Computing) ①

[테크월드=정환용 기자] 애초에 학습은 동식물에게나 적용할 수 있는 행위인 줄 알았다. 특히 인간은 ‘가르침을 통해 성장한다’는 기초적인 개념을 기반으로 지금까지 발전해올 수 있었고, 이는 앞으로도 변하지 않을 것이다. 컴퓨터가 더 높은 성능과 더 빠른 연산 속도를 내며 인간의 계산 능력을 앞선 것은 이미 수십 년 전의 일이지만, 지금까지의 컴퓨터는 창의적이지는 않았다. 멍하니 앉아 있다가 문득 ‘TV에선 뭘 하나’ 싶은 마음으로 TV를 켜 예능 프로그램을 보며 시간을 문화적으로 소비하는 것은 인간을 비롯한 생물만이 가능한 일이었다. 지금까지는 그랬다.

기계가 배우기 시작했다. 수능을 앞둔 수험생이 국․영․수 과목을 교과서 위주로 복습하는 것과 같은 맥락으로, 수많은 데이터가 주어지고 이를 바탕으로 더 나은 결과를 도출할 수 있도록 가르칠 수 있게 됐다. 최고의 체스 챔피언 카스파로프를 꺾은 IBM의 딥 블루가 그랬고, 질문의 내용을 파악하고 인터넷을 통해 답을 찾아내는 퀴즈 로봇 ‘왓슨’이 그랬으며, 인간이 평생 볼 수 없는 기보를 통해 최강의 기사로 거듭난 딥마인드의 ‘알파고’(AlphaGo)가 그랬다. 이제 ‘로봇’ 하면 영화에서처럼 긍정적인 세상과 부정적인 세상으로 나뉘어 상상할 정도로, 인공지능(Artificial Intelligence, AI)은 현실에 많이 가까워졌다.

딥 블루, 왓슨, 그리고 알파고는 인공지능이란 대괄호로 묶을 수 있지만, 그 종류나 성향은 조금 다르다. 디퍼 블루는 병렬 컴퓨팅으로 모든 경우의 수를 파악했고, 왓슨은 HDD에 저장된 약 2억 페이지의 구조화․비구조화 콘텐츠를 통해 문제의 정답을 찾아나갔다. 수많은 대국 기보를 통해 학습했다는 알파고 역시 기본 학습 구조는 다른 두 컴퓨터와 비슷하지만, 바둑의 경우의 수는 10의 171제곱으로 아무리 성능이 뛰어난 수퍼컴퓨터라 해도 모든 경우의 수를 파악할 순 없다. 그렇다면 알파고는 어떤 학습을 통해 세계 최강의 바둑 기사들을 상대로 (1패를 제외한) 전승을 거둘 수 있었을까?

Part 1. 기계학습으로 숙성되는 인공지능
Part 2. 고성능 컴퓨팅 시스템이 필요한 이유
Part 3. 다양한 HPC와 컴퓨터 소개

배우고 또 익히면 성장하지 않겠는가
기계학습으로 숙성되는 인공지능

컴퓨터의 발전에 지대한 공을 끼친 영국의 수학자 앨런 튜링은, 1950년 어떤 테스트를 제안한다. ‘이미테이션 게임’, 혹은 자신의 이름을 딴 ‘튜링 테스트’로 불리는 이 시험은, 질의응답을 통해 인간과 컴퓨터를 판별하는 과정이다. 두 답변자 중 한 쪽은 사람, 한 쪽은 컴퓨터고, 질문자가 어느 쪽이 컴퓨터인지 구분하지 못하면 테스트는 통과한다. 최근 개봉한 ‘블레이드 러너 2049’에서 주인공 케이가 이와 비슷한 음성 테스트를 받는 장면이 몇 차례 등장한다. 영화 속 테스트는 감정적 동요를 파악하기 위함이지만, 인간과 기계를 구분하기 위한 테스트란 점에서 튜링 테스트와 상통한다.

하지만 이 테스트의 대상인 기계는 수많은 예상 질문과 그에 대한 답변을 입력받고, 질문에 가장 ‘인간다워 보이는’ 대답을 선택하는 것이 한계다. 바둑 인공지능 알파고는 거듭된 성능 향상으로 이제 어느 기사도 이길 수 없는 존재가 됐지만, 바둑을 벗어나 ‘고양이를 그려 보라’는 명령에는 반응조차 할 수 없다. 현재의 기계 학습 앞에 놓인 벽 또한 이와 비슷한 개념으로, 기계가 스스로 학습하며 진화해 나간다는 개념 자체는 납득할 수 있으나, 그것을 우리가 생각하는 ‘지능’(Intelligence)이라 부를 수 있을지는 의문이다.

현재의 기계 학습은 지능 뿐 아니라 대부분의 통계적·체계적 산업에 활용될 수 있는 기술이다. 또한, 인공지능의 실현에 기계 학습이 필수 요건은 아니다. 기계 학습은 그 끝에 인공지능이 있는 것이 아니라, 인공지능에 다다를 수 있는 가능성 중 하나로 봐야 한다. 미국의 카네기 멜론 대학교에서는 컴퓨터공학의 심화 과정으로 기계 학습 석사과정 교육을 시작했고, 국내외 유수의 대학교에서도 기계 학습을 본격적으로 언급하고 있다. 목표에 도달하기까지는 수많은 난관들이 남아 있지만, 현재진행형인 기계 학습의 완성으로 인공지능에 좀 더 가까워질 수 있다는 전제 아래 다양한 분야의 전문가들이 한 걸음씩 나아가고 있다.

인터넷 검색의 단계로 보는 기계 학습의 세대별 특징

기계 학습을 본격적으로 접하기 위해선 먼저 배워야 할 수학 과목들이 몇 있다. 기계 학습의 초기 개념은 통계학과 상통하는 부분이 있는데, 기계 학습 자체가 통계학의 기본 구조에서 가져온 모델이 많기 때문이다. 대표적으로 신경망(Neural Network)을 구성하는 것도 통계학의 관점에서 보면 회귀모형(Regression Model)의 일종으로 볼 수 있다. 이밖에도 기자는 전혀 알지 못하는 미적분학, 선형대수학, 이산수학 등을 먼저 익히고, 기계 학습 알고리즘을 구현하기 위한 프로그래밍 언어도 익혀야 한다.

구글(Google) 이전에는 어떻게 인터넷을 이용할 수 있었는지 신기하다는 느낌이 문득 든다. ‘가능한 모든 정보를 찾는다’는 단순하면서도 방대한 명제는 많은 사람들을 만족시키기에 충분했다. 구글의 두 공동창업자는 매번 새로운 기술을 세상에 선보이고 있으며, 거의 모든 IT 분야에서 존재감을 드러내고 있다. PC통신 시절부터 이용해 온 인터넷, 특히 정보를 찾는 검색 기능에 기계 학습이 적용될 때, IT 생태계가 어떻게 진화하게 될지 알아보자.

1세대 - 주어진 정보 속에서 정답 찾기
약한 인공지능(Weak AI) 세대

초창기 인공지능은 가장 쉽게 떠올릴 수 있고, 지금도 다양한 플랫폼으로 구현돼 있다. 머신 러닝의 ‘학습’이란 단어를 사용하기에는 적합하지 않은 개념이지만, 관련 정보를 모두 모아놓고 그 속에서 필요한 정보를 빠르게 찾아내는 것이 당시의 검색 엔진의 역할이었다. 검색 엔진은 명확히 따지면 인공지능에 포함시키지 않는 것이 맞고, 검색 결과를 얼마나 빨리, 얼마나 정확하게 보여주느냐에 따라 그 성능의 가치를 따졌다. 마이크로소프트 빙(Bing), 구글(Google) 등의 지금까지 이어져 오는 웹 기반의 검색 엔진이다.

인터넷 검색엔진은 20세기의 알타비스타(AltaVista), 21세기의 구글로 양분할 수 있다. 최초의 상용 검색엔진은 1994년 첫 선을 보인 라이코스(Lycos)지만, 이후 1996년 출시된 알타비스타를 더 높이 평가하는 경우가 대부분이다. 고성능 하드웨어를 기반으로 검색 속도를 높이고, 여러 개의 단어를 함께 포함하는 정보를 검색할 수 있어 가장 많은 사람들이 이용한 검색엔진이기도 했다.

2세대 - 주어진 규칙 속에서 활로 찾기
정답으로 가는 더 빠른 길 알아내기

전 세대가 주어진 정보 속에서 질문의 답을 골라내는 수준이었다면, 그 다음 과제는 정답까지 도달하는 거리와 시간을 획기적으로 줄이는 일이다. 이 문제는 고성능의 프로세서와 메모리가 필수지만, 그 성능이 계속 향상된다고 해서 자동으로 해결되는 것은 아니다. 아무리 많은 정보가 주어진다 해도, 여기서 사용자가 ‘쓸 만한’ 정보를 찾아내지 못하는 이상은 이전 세대와 다를 것이 없다. 어떻게 하면 더욱 쓸 만한 정보를 찾아낼 수 있을까 하는 문제는 이미 1989년 영국의 팀 버너스 리(Tim Berners Lee) 경이 제안한 월드 와이드 웹(World Wide Web, WWW)과 함께 시작됐다.

공용 네트워크를 통해 모든 사람이 정보를 볼 수 있다는 점은 아직도 획기적이다. 하지만 문제는 수많은 정보들 속에서 가치 있는 정보를 찾아내는 것이다. 같은 정보라 해도 검색자에 따라 가치 척도가 달라지기 마련이고, 어디서 검색하느냐에 따라 그 질적 차이도 커진다. 통합 검색엔진을 통해서는 원하는 정보를 더 많이, 더 다양하게 얻을 수 있지만, 같은 정보를 국내에서 제공되는 포털 사이트에서 찾을 때는 그 온도가 사뭇 다르다. 2개 이상의 단어를 조합하는 검색에서는 언어에 따라 그 결과가 상당한 차이를 보이는데, 뉴스 검색으로 범위를 제한해도 그 차이는 얼음과 끓는 물만큼이다. 양과 더불어 정보의 정확도 역시 비슷한 수준의 차이를 보인다.

포털 사이트에서 ‘인공지능’을 검색했을 때의 결과를 예로 들어보자. 첫 번째로는 인공지능에 대한 정의, 그리고 네티즌들이 인공지능에 대해 어떻게 생각하는지에 대한 결과가 먼저 나온다. 관련 뉴스와 관련 책자, 네티즌들끼리의 문답과 관련 아이템 쇼핑, 학술 정보, SNS의 관련 포스트가 이어진다. 여기서 블로그 검색 결과를 자세히 보면, 10건 중 절반 정도는 바이럴 마케팅 포스트, 그리고 나머지는 관련 뉴스다. 쇼핑 항목에선 인공지능과 관계없는 제품이 첫 번째로 보이기도 한다.

이 결과는 인터넷에 떠있는 수많은 정보 중 제목과 내용에 포함된 ‘인공지능’이란 단어를 가장 먼저 선정한다(쇼핑 항목의 외국어 검색 결과(AI)를 보면 치환된 영단어도 함께 검색되는 것으로 보인다). 하지만 두 번째로 볼 수 있는 블로그 항목은 해당 포털에서 제공하는 블로그만 검색돼 범위가 제한적이고, 그마저도 광고가 대부분이어서 정보의 신뢰도가 높지는 않다. 또한, 포털이 아닌 커뮤니티나 다른 웹사이트 등 포털 사이트 자체와 연동돼 있지 않은 곳의 정보는 별도로 검색 옵션을 거쳐야 볼 수 있었다. 이는 ‘객관적’이라고 말하기 어려운 결과로, 검색어에 대한 결과물보다 검색어와 자사가 연관된 결과물을 더 많이 보여주는 것으로 해석된다.

10의 100승을 뜻하는 단어(구골, Googol)를 변경한 구글의 검색은, 전 세계 검색의 70% 이상을 차지하고 있다. 2008년에 이미 웹 페이지의 목록이 1조 개를 넘었다고 발표한 바 있으며, 한국을 비롯해 몇몇 나라를 제외하고 해당 국가 내 검색엔진 이용률 1위를 차지하고 있다. 이는 인터넷 이용자들이 어떤 정보를 원하는지에 따라 달라지는데, 서비스 자체의 품질보다는 이용자의 성향에 따라가는 경향을 무시할 수 없다. 때문에 국내 점유율이 낮다고 해서 안 좋다고 평가할 수 없고, 국내 점유율 1위라 해서 좋다고 평가하기도 애매하다.

구글에서 ‘인공지능’을 검색하면 해당 단어에 대한 위키백과, 뉴스, 영상, 관련업계 정보가 순서대로 나열된다. 학생이 어떤 주제로 리포트를 작성할 때, 적어도 국내 포털 사이트보다는 얻을 수 있는 정보가 더 다양해 보인다. 2개 이상의 단어를 조합 검색할 때도 마찬가지다. 한글로 찾을 때와 영어로 찾을 때의 결과가 다른 점으로 볼 때, 국내 웹 페이지의 정보에 차이가 있는 부분도 간과할 수는 없다. 국내 업계 뉴스나 쇼핑 정보, 관련 검색어 등을 찾을 때는 포털 사이트의 검색 결과가 더 나은 것도 사실이다. 다만 ‘한국’이란 굴레를 한 걸음만 벗어나면, 국내 검색 결과 위주의 포털 사이트와 전 세계 정보를 찾는 구글과의 검색 정보는 그 차이를 가늠할 수 없을 만큼의 격차를 보인다.

3세대 – 연산(Calculation)에서 이해(Understanding)까지
강한 인공지능(Strong AI)으로의 전환점

현재의 검색 기술은 아직 2세대로 임의 명명한 약한 인공지능에 대비하면 절반 정도에 머물러 있다. 이는 국내 포털이나 구글, 야후 등의 해외 서비스나 마찬가지다. 가장 보편적으로 알려진 인공지능은 딥마인드(DeepMind)의 CEO 데미스 허사비스(Demis Hassabis)가 만든 알파고다. 하지만 알파고의 목적은 단지 바둑기사들을 상대로 승리할 수 있는 기계가 되는 것이 아니다. 알파고의 연산에 적용된 신경망(Neural Networks), 딥러닝(Deep Learning) 등의 기술로 기계의 연산 능력을 지금까지의 통계학적 연산에서 벗어나 인간의 ‘생각’(Think)에 더 가까워지기 위한 시도다.

단순하게 생각해 보자. 현재의 검색엔진은 통계다. 그리고 수많은 정보 중 사용자가 원하는 정보에 더 가까운 결과를 제공하기 위한 기술적 접근 방법 중 하나가 기계 학습이다. 그러나 기본적으로 기계 학습을 위해서는 수많은 기초 정보가 필요하다. 기계가 아직도 개와 고양이를 구분하지 못하는 것은, 기계가 고양이의 생김새와 울음소리, 특징과 성향을 파악하지는 못하기 때문이다. 아마 한 대의 기계가 앞에 앉아 있는 동물이 개인지 고양이인지를 판단하는 것은 적어도 10년은 이르다는 것이 중론인데, 이는 인간이 대상을 가장 빠르고 정확하게 판단할 수 있는 요소인 ‘감각’(Sense)과 ‘판단’(Judgment)을 어떻게 기계에 적용할지 아직 속수무책이기 때문이다.

단계별로 보면, 1단계는 ‘필요한 정보를 찾아주는’ 단계, 2단계는 ‘필요한 정보를 더 빨리, 더 정확히 찾아주는’ 단계다. 현재까지 도달한 기계 학습 기술이 2단계에 적용될 때, 계속해서 늘어나는 정보들 속에서 유용한 정보를 솎아낼 수 있는 능력이 향상된다. 여기서 3단계로 한 발 더 나아가려면 어떤 명제가 필요할까? 기계 학습의 신경망 알고리즘이 극대화된 형태에서 실현 가능성이 보이는 확장 검색이 그 중 하나가 아닐까 싶다. 웹 페이지 뿐 아니라 데이터베이스에는 없지만 전 세계로 연결된 네트워크로 찾을 수 있는 현장 정보까지 찾을 수 있다면, ‘검색’이란 단어가 가지는 의미가 더 깊어지지 않을까?

회원가입 후 이용바랍니다.