[재미있는 기상이야기] ‘AI 일기예보 시대’ 앞서 가려면···
[아시아엔=최영진 강릉원주대 강사, 차세대도시·농림기상기술개발사업단장 역임] 우리나라에서 하루에 생산되는 ‘기상 데이터’는 약 1TB가 넘는다. 컴퓨터가 읽고 처리할 수 있는 최적의 형식으로 생산되며, 품질검사까지 실시간으로 처리되어 나온다.
마치 수도꼭지에서 물이 나오듯이 끊임없이 산출되며, 기류가 움직이는 패턴이 들어있는 품질 좋은 데이터 수십년 치가 쌓여 있다. AI가 데이터를 읽고, 패턴을 찾아내고, 스스로 학습하여 의미를 찾아내기에 최고의 매력적인 데이터라 할 수 있다.
게다가 개인정보나 사적 이익과 관련이 없으며, 국민의 세금으로 생산한 정부 데이터인 까닭에 정책결정만 잘 한다면, 일기예보 정확도 향상은 물론 AI 기술 향상을 위한 최고의 테스트베드가 될 수 있다. 데이터는 4차산업의 중요한 요소 중의 하나이기 때문이다.
2017년 말 KISTEP(한국과학기술기획평가원)의 4차산업관련 포럼 발표에 따르면, 2016년 구글에서 AI 알고리즘 텐서플로우(tensorflow)를 무료로 개방한 것을 기점으로 향후 AI 발전이 가속화되겠지만 데이터는 매우 비싸서 무료로 개방되기 어려울 전망이다.
일기예보는 기계학습에 매우 적합하다. 이용가능한 날씨에 관한 정보범위는 엄청나게 크다. 현재 우주에는 구름 패턴·바람·기온 등의 데이터를 제공하는 1000개 이상의 기상위성이 있다. 인공위성의 자료는 일부에 지나지 않는다. 전 세계에 있는 정부 및 개인 기상관측소 수십만 곳에선 실시간 데이터가 지속적으로 수집되고 있다.
2013년, 유럽지구과학학회(European Geo-Science Union) 특별세션에서 기상데이터와 빅데이터 플랫폼 사용의 기술적 문제 및 활용에 관한 주목할 만한 발표들이 있었다. 아마존이 미국 정부의 기상데이터 플랫폼을 사용해서 날씨정보를 산출·사용하는 것이 대표적인 사례였다.
최근에 마이크로소프트는 인공지능을 이용한 일기예보 시스템을 개발했는데 그 정확도는 기존 일기예보 모델을 훨씬 능가하고 있다. 미국의 여러 기상회사들은 AI를 사용한 서비스를 제공하고 있다.
왓슨으로 유명한 IBM의 일기예보 관련 투자 규모는 엄청나다. IBM은 Weather.com, Weather Underground, The Weather Company 등을 거느리며 모바일 및 클라우드 기반 웹속성의 기상정보를 B2B로 서비스하고 있다.
러시아의 인터넷 회사 Yandex도 기계학습 기반의 일기예보 프로그램을 개발했다. 얀덱스는 초정밀 일기예보에 이 프로그램을 사용할 계획인 것으로 전해졌다.
이런 상황에서 우리 한국도 AI가 공급하는 일기예보를 이용하게 되는 것은 시간문제다. 혹자는 일기예보나 기후변화와 관련한 이슈에 크게 궁금한 것이 없다고 말한다. 그만큼 현재의 사회 기반이 잘 되어있다는 의미일 것이다.
실제로 강력한 태풍이나 호우 등의 극한기상이 나타나도 인프라가 잘 되어 있으면 재산피해는 더러 증가할 수도 있지만, 인명피해는 감소하고 있다. 하지만 최근 이같은 견해를 뒤엎는 사례가 생기고 있다.
미국은 지난해 역대 최고의 재난피해를 입었다. 2017년 미국은 폭풍, 산불, 홍수 및 이상고온 등으로 4000억 달러의 재산피해가 났다. 북부 캘리포니아 산불은 22명의 목숨을 앗아갔다. 기상학자들은 향후 이런 재난발생은 더 많이 일어날 수 있다고 말한다.
우리나라는 기상재해로 인한 농업분야 피해보상으로 매년 1000억원 정도를 지급하고 있다. 우리나라의 기상데이터는 현재 일기예보와 연구 목적에 한정돼 사용된다. 데이터의 완전한 개방을 통해 농업·에너지·교통·물류·수자원·재해 등의 여러 전문분야와 초연결 지능 네트워크 등이 구축된다면, 4차산업 발전에도 크게 기여할 전망이다.
이를 위해서는 데이터 개방을 위한 적극적 정책결정과 사용자 지원 플랫폼이 준비되어야 한다. 플랫폼 기술은 이미 상용화되었으니 실질적으로는 정책결정만 잘 하면 된다.
기상데이터와 AI기술의 융합이 한국의 4차산업에 기여할 분야는 상상을 초월한다. 바야흐로 ‘기상산업의 시대’가 성큼성큼 우리 곁에 바짝 다가오고 있는 것이다.