인간 뇌 신경망 모사로 획기적 발전… 인공지능 연구·실용화 현주소
컴퓨터가 막 도입되기 시작한 1960년대. 과학자들은 자신만만했다. 컴퓨터의 연산 속도는 하루가 멀다 하고 빨라졌다. 10의 10배를 구하기 위해서 곱하는 대신 10을 열번 더해야만 하는 구조적인 한계에도 불구하고 컴퓨터의 위력은 막강했다. 프로그램을 개선하고, 하드웨어의 성능을 바꿀수록 컴퓨터는 점점 더 많은 영역에서 힘을 발휘하기 시작했다. 과학자들은 “10년 후에는 사람처럼 생각하는 인공지능이 현실화할 것”이라고 단언했다. 그러나 지나친 낙관이었다. 1980년대에 이르러서도 컴퓨터는 단순히 빨라지기만 했다. 사람처럼 생각하고, 스스로 배우는 분야에 있어서는 발전이 없었다. 이후 ‘인공지능의 겨울’이라는 비관적인 시각이 오랫동안 이 분야를 지배하기 시작했다. 2010년대에 들어서야 과학자와 기업들은 인공지능의 겨울을 벗어날 수 있는 실마리를 찾아내기 시작했다. 컴퓨터의 시각 인식, 언어 인식, 분자구조 분석을 통한 신약 예측 등 최근 발표되고 있는 성과들은 컴퓨터가 인공지능에 점차 다가서고 있다는 명백한 증거로 평가되고 있다.
컴퓨터에게 사람의 사고방식을 가르치는 기술을 ‘딥 러닝’이라고 부른다. 딥 러닝의 초창기 결과물들은 이미 우리 주변에서 상용화돼 있다. 뉴언스 커뮤니케이션의 언어 인식 프로그램을 도입한 애플의 ‘시리’는 아이폰과 아이패드에 탑재돼 사람들의 궁금증을 풀어주는 비서 역할을 한다. 또 검색엔진 구글의 ‘스트리트 뷰’ 서비스는 특정한 주소를 인식해 이미지로 보여줄 수 있는 인공지능 프로그램을 적용했다.
하지만 최근 기업과 과학자들이 공개한 딥 러닝의 새로운 결과는 기존의 수준을 획기적으로 뛰어넘는다. 사람 뇌 속의 신경망을 모사한 ‘인공 신경 네트워크’ 또는 ‘뉴럴넷’으로 불리는 시스템이 등장한 덕분이다. 벨연구소에서 필기 인식을 개발한 인공지능 분야의 선구자 얀 리쿤 뉴욕대 교수는 뉴욕타임스와의 인터뷰에서 “뉴럴넷을 비롯한 새 기술들은 기존의 기술을 뇌사상태에 빠지게 할 정도로 막강한 전환을 가져올 것”이라며 “현재 이 기술들이 보여주고 있는 방향이 명백하게 옳다는 데 이견이 있을 수 없다.”고 강조했다.

뉴욕타임스 홈페이지
리처드 라시드 마이크로소프트 최고과학자가 지난달 중국 톈진에서 열린 한 회의에서 언어인식 프로그램을 활용해 연설하고 있다. 라시드 뒤쪽의 왼쪽 화면에는 영어 자막이, 오른쪽에는 중국어 자막이 실시간으로 떴다.
뉴욕타임스 홈페이지
뉴욕타임스 홈페이지
●신약 될 가능성 높은 분자 찾는 SW도 개발
지난 10월 제프리 힌튼 토론토대 교수는 다국적 제약사인 머크가 주최한 소프트웨어 경진대회에서 신약이 될 가능성이 높은 물질을 분자 중에서 찾아줄 수 있는 소프트웨어를 개발해 우승을 차지했다. 힌튼의 소프트웨어는 정체가 알려지지 않은 15개 화학물질의 구조식 속에서 효과적인 약품이 될 수 있는 것을 정확하게 찾아내 세계적인 주목을 받았다.
학계가 이 소프트웨어에 주목한 것은 개별 물질에 대한 특별한 정보나 연구결과를 제시하지 않았는데도 원하는 목표에 정확히 도달했다는 점이다. 힌튼은 프로그램과 소규모 데이터베이스만으로 약품과 가장 유사한 구조를 파악할 수 있도록 설계했다. 그 외는 스스로 판단할 수 있도록 유도했다.
데이터 전문기업 케글의 최고경영자(CEO) 앤서니 골드블룸은 “힌튼의 사례는 딥 러닝이 진정한 결과물을 보인 첫 번째 사례라고 할 수 있다.”면서 “특히 데이터양이 극도로 제한된 상황에서 원하는 결과물을 얻은 것은 지금까지의 어떤 소프트웨어보다 효율적으로 배우고 스스로 판단하고 있다는 것을 입증한 것”이라고 밝혔다.
●1400만장 사진 2만개로 분류땐 정확도 15.8%
딥 러닝의 성과는 다양한 분야에서 활용이 가능하다. 무엇이 사용자의 기호에 맞는 것인지를 고려한 애플리케이션의 정렬 프로그램뿐 아니라 마케팅이나 치안에도 쓸 수 있다. 예를 들어 사람들의 구매 습관에 대한 데이터베이스를 활용해 구매고객에 따라 스스로 진열을 바꾸는 상점을 만들거나, 얼굴인식의 기능을 획기적으로 개선한 통합 범죄 감시 시스템을 구축할 수도 있다.
딥 러닝이 구현한 인식기술은 이제 사람과의 경쟁에 나서고 있다. 문서는 정형화된 구조로 돼 있어 검색이 쉽지만, 이미지나 비디오는 약간의 변형이나 각도 전환만으로도 완벽하게 일치하지 않기 때문에 일정 수준 이상의 ‘판단’이 필요하다. 결국 이미지와 비디오 검색이 가능하다는 것은 인공지능이 제대로 작동하고 있다는 것을 의미한다. 페이스북에는 2000억장의 사진이 게재돼 있고, 매분마다 72시간 분량의 새로운 비디오가 올라온다. 이 같은 데이터가 용량만 차지하는 쓰레기가 되지 않기 위해서는 분류가 필요하지만, 기존의 기술로는 이를 자동화할 방법이 없었다.
지난해 스위스 인공지능연구소 연구진은 자체적으로 개발한 딥 러닝 기술로 사람들과 교통표지판 인식 대결을 벌였다. 연구진의 딥 러닝 프로그램은 총 5만장의 표지판 그림 중 99.46%를 정확하게 인지해내 32명의 사람들로 구성된 인간팀의 99.22%를 앞섰다. 오랜 운전경력을 가진 인간팀의 개인당 정확도는 98.84%였다.
하지만 교통표지판처럼 명확한 한계를 설정하지 않으면, 아직 갈 길이 멀다. 올여름 구글과 스탠퍼드대 연구팀은 1만 6000대의 컴퓨터를 사람의 뇌 신경처럼 연결해 1400만장에 이르는 사진을 2만개의 카테고리에 자동으로 분류하는 작업을 진행했다. 최종 분류의 정확도는 15.8%에 불과했다.
프로젝트 책임자인 제프 딘은 “이전에 최고 수준으로 평가받던 이미지 인식 기술보다 70% 이상 향상된 수치인 만큼 아직까지 무궁무진한 개선의 여지가 있다.”면서 “아무리 숙련된 사람이라도 5분에 250개가량의 이미지만 분류할 수 있고, 이는 인간의 힘으로는 정보처리가 불가능하다는 것을 의미한다.”고 지적했다.
●“딥 러닝 프로그램 더 교육받으면 완벽해질 것”
언어인식에 있어서도 괄목할 만한 발전이 있었다. 사람의 언어는 ‘자연어’이기 때문에 사용자의 의지에 따라 셀 수 없이 많은 조합이 가능하다. 아무리 방대한 데이터베이스를 구축한다고 해도 완벽하게 모든 의미를 번역한다는 것은 불가능에 가깝다. 리처드 라시드 마이크로소프트 최고과학자는 지난달 중국 톈진에서 열린 회의에서 딥 러닝을 이용한 언어인식의 한계와 가능성을 동시에 제시하는 무례한 퍼포먼스를 선보였다. 라시드는 객석을 가득 채운 중국인 청중 앞에서 영어로 연설을 진행했고, 통역자도 없었다. 라시드의 뒤에 설치된 거대한 두 개의 스크린에는 라시드의 언어를 인식한 영어 자막과 이를 컴퓨터가 번역한 중국어 자막이 실시간으로 떴다. 마이크로소프트가 개발한 딥 러닝 프로그램을 이용한 이 실험은 최종적으로 70% 정도의 정확성을 나타냈다.
라시드는 회사 홈페이지에 “4~5개 단어에 하나씩 틀리던 프로그램이 이제 7~8개 단어에 하나씩 틀리는 수준으로 향상됐다.”면서 “딥 러닝 프로그램이 더 많은 교육을 받으면 언젠가 완벽해질 것”이라는 글을 올렸다. 마이크로소프트의 언어인식 프로그램 개발은 1979년 시작됐다. 더디기는 하지만, 인공지능의 목표에 다가가고 있는 것은 분명하다.
박건형기자 kitsch@seoul.co.kr
2012-11-27 25면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지