[인공지능 작가시대①] 알파고 바둑기사 옛말, 스트레이트 기사 작성까지
[아시아엔=이원섭 마컴 빅데이터 큐레이터] 인공지능 바둑기사 알파고가 이세돌을 꺾으면서 인공지능(AI)에 대한 보편화가 이루어졌다. 알파고가 있기 이전에도 이미 인공지능 게이머 IBM의 왓슨(Watson)도 있었다. 1997년 가리 카스파로프 체스게임에서 IBM 딥 블루(왓슨)가 체스 세계챔피언 가리 카스파로프를 꺾고 우승을 차지한 것이다.
이후 IBM은 이 기술을 더욱 발전시켜 인공지능 닥터로까지 발전시킨다. 도쿄대 의과학연구소와 IBM왓슨의 공동연구에서 인공지능을 이용, 2000만건의 논문을 학습시킨 후 진단과 연계하는 연구를 통해 자칫 악화될 뻔했던 환자를 단 10분만에 정확하게 진단해 쾌유에 큰 도움이 되었다.
이처럼 인공지능의 진화는 인간의 전문 일자리까지 파고 들고 있다. <소유의 종말>, <바이오테크시대> 등 많은 경제학 서적을 출간한 대표적인 경제학자인 제레미 러프킨은 그의 저서 <노동의 종말>에서 첨단기술이 인간 삶을 풍족하게 만드는 것이 아니라 일자리를 사라지게 만든다고 주장하기도 했다.
요즘 핫이슈인 제4차산업혁명은 3차산업혁명의 근간인 디지털정보통신 산업 발전의 연장선상에 있다고 보는 게 정확하다. 4차산업혁명의 인프라는 초연결(hyper connection)인데 4차산업혁명의 핵심키워드인 융합과 연결을 가능하게 하는 기초 기둥과 같은 것이다. 정보통신기술의 발달로 세계적인 소통이 가능해지고 개별적으로 발달한 각종 기술의 원활한 융합을 가능케 한다. 이 연결과 융합이 지금까지 전혀 예상치 새로운 부가가치 산업을 만들어 낼 것이다. 따라서 3차산업혁명시대의 마인드로는 어쩌면 도태될 지도 모른다.
퀀텀 컴퓨팅 전문가, 데이터 사이언티스트, 센서 전문가, 셰어링 이코노미스트(sharing economist), 6차산업 컨설턴트, 펫 페터(pet petter) 등 지금은 생소한 직업들이 유망한 직업으로 떠오르고 있다.
이런 변화는 필자가 일하고 있는 분야에서도 이미 일어나고 있다. 2014년 LA 지진 때 가장 신속하게 보도자료를 쓴 것은 사람이 아니라 인공지능 기자(?)였다. 물론 뉴스페이퍼에는 담당기자의 실명으로 게재되었지만 지금 기자들처럼 일일이 취재하고 분석하고 몇번의 교열과정을 거친 것이 아니라 인공지능 컴퓨터가 제공하는 관련된 정형화 데이터들을 정리해 기사를 완료하기만 했다.
LA지역에 오전 6시25분경 강도 4.4의 지진이 발생한다. 미국지질조사소(USGS, United States Geological Survey)는 즉각 지진 관련 데이터를 수집, 경고를 발령하고 동시에 정형화된 데이터를 API(Application Programming Interface)를 통해 제공해 준다. 이 지진 데이터는 바로 LA Times 담당기자에게 지진 발생 기사 발행 준비가 끝났다는 메시지로 전달되어 볼 수 있다. 이 데이터를 받은 기자는 팩트 데이터들을 정리한 뒤 CMS(Content Management System)에서 발행 버튼만 누르면 한 편의 기사가 발행되는 것이다.
위의 화면에 보이는 ‘Earthquake aftershock: 2.7 quake strikes near Westwood’라는 타이틀과 동일하게 말이다.
이 <LA Times> 기사는 언론사 가운데 가장 빨리 지진 사실을 단 8분만에 속보로 내보내는데 성공했다. 이 과정에서 기자가 한 일이라곤 팩트를 확인하고 발행버튼을 누른 것이 전부였다. 만약에 이 인공지능 기자의 데이터 신뢰성이 높아진다면 속보 발행시간은 8분보다 훨씬 더 줄어들 것이 분명하다.
머신러닝처럼 알고리즘이 작성하는 인공지능 기자는 이제 언론사들이 많이 보유한 상황으로 그리 대단한 일이 아니다. 미국의 <LA Times>, <로이터> 등은 일찌감치 이 시스템을 도입했고 우리나라의 <파이낸셜뉴스>도 이 인공지능 기자를 활용하고 있다.
LA Times의 Schwencke가 개발한 Computational Writing 알고리즘 가운데 지진 기사를 담당하는 로봇의 이름은 ‘Quakebot’다. Quakebot은 진도 3.0 이상의 지진이 발생하면 자동적으로 작동해 API를 통해 불과 몇 초 만에 전달된 데이터로 기사를 작성하고 CMS에 등록한다. 스트레이트 기사는 대부분 6하원칙(5W1H)만 충족하면 기사 요건을 만족하기 때문에 문장 구조에 맞게 데이터만 배치하면 간단한 문장이 만들어지고 타이틀도 동시에 쉽게 추출된다.
미국 노스웨스턴대 Narrative Science는 LA Times 보다 한층 고도화된 스토리텔링 기술을 개발해 신문사에서 활용하고 있다. 컴퓨터 스토리텔링 솔루션 ‘Quill’은 데이터마이닝을 거쳐 인공지능 알고리즘에 의한 구조화, 분석, 해석, 조직화, 작성에 이르는 과정이 모두 인공지능 기자로 대체되고 있을 정도다.
LA Times는 여러 봇(인공지능 기자)을 활용해 지진 기사뿐만 아니라 여러 기사를 작성하고 있다. 자살 데이터를 기반으로 한 자살 관련 기사, LAPD가 제공한 범죄사건 데이터를 받아 중범죄 사건 등을 분류해 기사 작성에 참고하고 있다.
이렇게 단순 데이터를 가공하는 작업, 특히 속보 관련 기사 등 간단한 스트레이트 기사는 얼마든지 인공지능 기자가 대신할 수 있어 기자들은 기획기사나 심층성 있는 기사를 쓸 수 있어 고품질 기사로 언론사 경쟁력을 높이는 역할에도 기여하고 있다.