[알기쉬운 AI③] 데이터사이언티스트 첫 걸음

데이터는 수없이 많은 가운데 중요한 것은 취사선택이다. 출처 the Great World Meson
2020년 올해는 21세기 3번째 10년의 첫해, AI(인공지능)은 이제 시대적·공간적인 대세로 확고히 자리잡고 있습니다. 하지만 일부 전문가들을 제외하고 대중들의 AI 관련 활용은커녕 지식도 매우 낮은 수준에 머물고 있습니다. 이에 <아시아엔>은 전문가들 용어 대신 일상 용어로 AI 기초지식부터 하나씩 풀어 소개할 계획입니다. 이 글을 연재하는 최종헌 필자는 <파이썬 초보 학습자를 위한 4시간에 배우는 파이썬 기초문법> 저자로 어떻게 하면 인공지능을 쉽게 가르칠까 고민하는 교육자입니다. <편집자>

 

요즘 미래의 유망직업 이야기를 하면 꼭 들어가는 직업이 ‘데이터 사이언스를 하는 사람’ 즉 데이터 사이언티스트(데이터과학자)다. 세종대가 데이터사이언스학과를 개설하는 등 국내대학에서도 관심을 갖고 있다.

또 ‘글래스도어’란 해외 직장평가 기업에서도 데이터과학자를 2020 유망 직종 3위로 예상하는 등 ‘핫한’ 직업으로 꼽힌다.

오늘은 데이터사이언티스트란 직업에 대해 알아보고 이 방면으로 어떻게 진출할 수 있을까 생각해 보자.

헷갈리는 용어 정의

우선 인터넷에서 찾다 보면 데이터분석가, 데이터과학자, 데이터엔지니어란 단어가 나온다. 이 직업이 생긴 지 얼마 되지 않았기 때문에 해석도 다르고 하는 일도 회사마다 달라서 헷갈릴 수 있다. 간단히 아래와 같이 정의하면 초보자들에게는 가장 쉬운 분류법이 될 수 있을 것 같다.

너무 일반화하는 경향이 있겠으나 모르는 분을 위한 단순 분류이니 전문가들은 이해하길 바란다.

△데이터 분석가
본래 엑셀로 분석하던 일을 인공지능 관련 도구로 분석하는 사람이라고 생각하면 된다.

△데이터 과학자
데이터 분석가가 하는 일을 좀더 전문적인 인공지능 도구로 다루는 사람들이다.

△데이터 엔지니어
본래 프로그래머를 하던 사람들이 빅데이터, 인공지능 관련 데이터를 모으고 관리하는 일을 하고 있다고 보면 된다.

굳이 과학자일 필요는 없다

실제 직장에서 데이터사이언티스트는 데이터분석가와 데이터과학자를 합친 개념으로 쓰인다. 알다시피 혼자서 모든 일을 다 할 수는 없다. 해당 분야 가령 패션, 유통, 금융 등 분야의 지식을 갖춘 데이터 분석가와 수학 및 통계 그리고 분석용 기술을 배운 데이터 과학자가 함께 일하는 것이 일반적이다.

그리고 분석용 기술은 엑셀 함수를 잘 다루는 수준 정도의 난이도에 불과해 말이 과학자지 실제로 과학자일 필요는 전혀 없다.

따라서 당신이 엑셀에 관련해 ‘도사’라면 전직하는데 문제가 없을 것이다. 요즘 주변에 엑셀 좀 다루는 사람들 중에 데이터사이언티스트로 전직하는 것에 대한 문의가 많다.

기본적으로 하는 일은 엑셀로 할 때와 큰 차이가 없다. 단지 데이터과학자는 엑셀로 하기에는 큰 데이터를 다루고 과거의 분석보다 미래의 예측에 더 초점을 맞추기 때문에 새로운 도구를 쓰는 것일 뿐이다.

당신이 엑셀을 능수능란하게 다룬다면 난이도 때문에 걱정할 필요는 없다.

그럼 데이터과학자가 되려면 무엇을 배워야 하는가? 우선 ‘파이썬’이란 컴퓨터 언어를 간단하게라도 배우기 바란다. 매우 쉽다. 몇 시간이면 가능하다. 이어서 구글에서 운영하는 머신러닝 대회인 캐글(Kaggle)에 참가해 배우기를 추천한다.

어렵게 생각하기 쉬우나 가장 빠른 길이다. 유튜브에 보면 캐글을 가르쳐주는 많은 영상이 있다. 캐글에 대해서는 다음 시간에 다시 이야기를 하겠으나, 우선 가입하여서 꼭 시도해 보시기를 추천한다. 다음 글에서는 캐글에 대해 구체적으로 알아보겠다.

Leave a Reply