[알기쉬운 AI②] ‘머신러닝’과 ‘딥러닝’ 어떻게 다른가?
2020년 올해는 21세기 3번째 10년의 첫해, AI(인공지능)은 이제 시대적·공간적인 대세로 확고히 자리잡고 있습니다. 하지만 일부 전문가들을 제외하고 대중들의 AI 관련 활용은커녕 지식도 매우 낮은 수준에 머물고 있습니다. 이에 <아시아엔>은 전문가들 용어 대신 일상 용어로 AI 기초지식부터 하나씩 풀어 소개할 계획입니다. 이 글을 연재하는 최종헌 필자는 <파이썬 초보 학습자를 위한 4시간에 배우는 파이썬 기초문법> 저자로 어떻게 하면 인공지능을 쉽게 가르칠까 고민하는 교육자입니다. <편집자>
‘머신러닝’과 ‘딥러닝’. 요즘 자주 듣는 말들인데 둘은 같은 것인가 아니면 다른 것일까? 섞어서 쓸 때가 많은데 정확히는 두 단어의 의미는 차이가 있다.
머신러닝은 “사람이 제공해준 데이터 항목을 가지고, 컴퓨터가 학습한 다음 데이터의 규칙성을 찾아서 향후 주어지는 과제에 대해 판단을 하거나 예측을 하는 시스템”을 말한다. 여기서 중요한 것은 “사람이 제공한 항목들”이다.
예를 들어 신인 프로농구 선수가 장차 언제까지 선수로서 활동을 할 수 있을까 하는 ‘선수 수명’을 예측한다고 가정해보자.
이를 위해서는 은퇴 농구선수의 항목 데이터를 컴퓨터에게 학습시켜야 한다. 데이터 항목이란 은퇴 농구선수 수백명의 키, 체중, 학창시절 부상 여부, 달리기 기록, 점프 기록, 포지션, 득점, 리바운드, 어시스트, 파울 등의 자료와 각 선수의 프로 활동 기간을 자료로 학습데이터를 만든 것을 의미한다.
다음으로 이를 학습해 규칙성을 찾게 한다. 과체중인 선수는 은퇴를 빨리한다. 무릎 부상 경력이 있으면 단명한다. 달리기가 빠를수록 오히려 은퇴를 일찍 한다 등의 규칙성을 찾을 것이다.
이에 따라 이미 은퇴한 선수들이 몇년 활동을 하고 은퇴했는지를 알고 있는 컴퓨터는 이의 규칙성을 기반으로 이제 프로생활을 시작하는 신인 선수들의 기대 활동기간을 예상해낸다.
반면 딥러닝은 “인공신경망을 활용하여 사람의 뇌와 비슷한 구조로 이해하여, 컴퓨터가 스스로 학습해 향후 주어지는 과제에 대해 판단·예측하는 시스템”을 말한다.
예를 들어 고양이인지 강아지인지 인식하는데 딥러닝은 머신러닝 같이 항목들이 필요한 게 아니다. 대신 고양이 사진과 강아지 사진을 엄청난 숫자로 제공해준다. 그리고 이것은 고양이, 저것은 강아지라고 분류해주면 딥러닝은 사람의 뇌가 인식하는 방식으로 학습한다.
이런 과정을 거친 후 딥러닝 네트워크는 적절한 분류체계를 찾아내어 향후 입력되는 사진이 강아지인지 고양이인지를 가려낼 수 있게 된다.
사람이 판단하는 것은 두 가지로 나눌 수 있다. 하나는 ‘Think fast’, 다른 하나는 ‘Think slow’. 고민하고 분석해야 하는 ‘Think slow’ 타입의 일은 머신러닝이 좀더 잘 한다. 반면 한눈에 보고 결정해야 하는 것은 딥러닝이 좀더 잘 할 수 있다고 보면 된다.