고급수준의 전문인력 양성 시급...장기적·전략적 프로그램 마련해야

   
▲ 구글 빅데이터 관심 추이

의외로 빅데이터에 대한 관심이 식지 않고 있다. 이는 비단 국내에서만의 특수한 현상도 아닌 듯 싶다. 본격적으로 빅데이터에 대한 관심이 늘어나기 시작한 2011년 하반기 이후로 지금껏 그 관심은 꾸준하게 꽤나 빠른 속도록 증가해 왔다. 게다가 우리 나라의 관심 수준은 전세계적으로 상당히 높은 편에 속한다. 참고로 구글 검색지수를 살펴보면 서울이 전세계 도시 중 7위를 차지하고 있고, 대한민국이 홍콩, 대만, 미국을 제치고 3위에 올라있다. 대한민국보다 높은 관심을 보이는 곳은 인도와 싱가포르이다. 인구수를 고려한다면, 대한민국의 관심은 매우 높은 수준이다. 여기에 우리 말로 ‘빅데이터’라고 치거나 네이버에서 검색하는 것 등을 합한다면 어마어마한 양이라 할 수 있을 것이다.

그럼에도 불구하고 주변에서 빅데이터에 대한 기대감 섞인 이야기를 듣기는 매우 어렵다. 빅데이터를 통해 매출을 늘려야 하는 기업들도 큰 기대를 하지 않는 듯 하고, 공공기관들 역시도 어떤 큰 기대나 확신을 가지고 사업을 추진하는 모습과는 다소 거리가 있어 보인다. 대체 어디서 문제가 있기에 이런 이상한 현상이 나타날까? 대체 저 관심은 어디서 온 것일까?

세간의 관심은 바로 일자리를 찾는 것이다. 연관검색어로 ‘빅데이터 전문가’, ‘빅데이터 교육’ 등이 주로 나오는 것은 이를 뒷받침 한다. 특히 젊은 학생들이 자신의 미래에 대한 대안으로 빅데이터를 전문가를 생각한다는 것이다. 다른 나라에서도 일자리 부족은 심각한 문제이고, 젊은이들은 가능성이 보이는 분야를 찾아 미리 대비하고자 열심이다. 그러나, 여기서 문제가 생긴다. 빅데이터가 성과를 내고, 더 많은 일자리를 만들어내기 위해서는 전문 인력의 양이 아니라 질 확보가 우선이기 때문이다. 빅데이터에서 데이터를 처리하고 분석할 사람이 필요한 것은 당연하지만, 이 때 필요한 사람은 주로 초보자가 아닌 상당한 전문성을 가진 사람들이다.

부존자원도 많지 않고, 글로벌 경쟁도 치열하지만, 그래도 빅데이터는 우리 나라가 상대적으로 발전된 정보통신 ICT 기반 덕분에 한번 도전해 볼만한 영역으로들 생각한다. 그러나 그 희망을 진짜로 실현하고, 글로벌 베스트 프랙티스를 만들고 싶다면, 최고 수준의 고급 인력 풀이 필요하다. 전세계에서 가장 큰 규모의 빅데이터 시장을 형성하고 있는 본부라 할 수 있는 실리콘밸리를 움직이는 것은 최고의 고급인력과 이들을 그 곳에 모을 수 있을 만큼의 자본이다. 백만명의 열정적인 대학생들이 노력한다고 이를 대치하는 것은 불가능하다.

전문적인 데이터 과학자 풀을 가지고 있는 기업으로 대표적인 링크드인을 살펴보자. 이 회사는 여러 분야의 전문인들을 회원으로 모아 네트워크를 형성시켜주는 사업을 한다. 역사가 길지 않으나 이미 전세계에 4억명에 육박하는 회원 풀을 확보했다. 그 많은 회원들에 대한 수많은 항목들을 데이터로 축적하면서 해야 할 일은 당연히 데이터 분석이며 이는 150명 규모의 데이터 과학 팀이 담당한다. 오천명 전직원수 대비 3%를 차지한다. 작년까지는 40명 규모에서 최근 급격 확대되었고 둘로 나누어졌다. 하나는 데이터 제품을 만들고 나머지는 인사이트를 도출한다.

150명이 많아 보이는가? 오히려 고급인력으로 매우 효율적으로 작업을 수행하기 때문에 150명의 ‘소수’로 운영 가능한 것이다. 4억명의 회원들이 매일 발생시키는 수많은 그리고 다양한 디지털 흔적들의 의미를 파악하고 이를 자동화 시키는 작업을 위해 결코 많은 수가 아니다.

대표적으로 데이터분석 전문인력이 많다고 알려진 국내 신용카드회사들이 한 회사에 수백명이 직접적 분석 업무를 수행한다고 한다. 그러나, 겨우 1~2천만명 고객의 신용카드 내역을 분석한다. 링크드인의 분석 깊이와 폭, 데이터 량은 국내 신용카드에 비할 바가 아니다.

데이터 과학자들은 이전의 통계분석가들과는 상당히 다르다. 활용 가능한 데이터의 파악, 기획, 해결할 문제의 정의, 내외부 정형/비정형적 데이터 수집과 클렌징 등 가공, 통계뿐 아니라 기계학습까지, 고도의 분석기법 적용, 분석결과 시각화에 이르기 까지 넓은 범위를 소화한다. 대학의 한 학과에서 가르치는 것이 불가능한 정도의 다양한 역량을 필요로 한다.

통계학이나 컴퓨터공학을 전공하고 대학을 마친 학생들이 조금만 공부하면 바로 데이터 과학자가 될 것이라는 황당한 상상은 매우 위험하다. 기업들이 내놓는 구인공고들을 보면 거의 대부분 3~5년의 실무경험에 직접 관련분야 석박사학위 이상을 요구한다. 대학을 바로 마친 학생들은 이력서를 내볼 기회조차 없는 것이 현실이며 이는 상당부분 당연한 것이다. 미국 경우에도 데이터 분석 업무에서는 다수가 석박사 이상 학위 소지자이며 이들이 빅데이터 전문조직을 이끈다. 이런 현실과 작동원리를 이해하지 못한 채 정부나 공공에서 초급 수준 과정에 ‘전문가 양성’ 이라는 명칭을 부여하는 경우가 늘어나는 것도 걱정된다. 젊은 학생들에게 부적절한 희망을 주고 시간을 낭비하게 하는 것도 위험하고 다른 용도로 사용될 수 있는 재원이 버려지는 것도 안타깝다.

인사이트 데이터 사이언스 펠로우쉽 프로그램이라는 미국의 데이터 사이언티스트 양성 과정은 흥미로운 비교 대상이다. 컴퓨터 공학이나 통계학 같은 직접 관련 전공을 하지 않은 박사학위 소지자들을 대상으로 7주간 진행되는 프로그램으로 강의는 없고 자율적인 프로젝트를 통해 스스로 실무 역량을 확보하게 한다. 과정 종료 후 전원이 데이터 과학 분야로 취업한다고 한다.

태권도에서 사범과도 같은, 선생님이 부족하다는 점도 생각해야 한다. 먼저 고급수준의 전문인력부터 양성한다면 그 효과는 다단계로 확산된다. 그 전문인력들이 또 누군가를 가르치게 되기 때문이다. 소요되는 비용과 예산도 수만 명 초보자를 양성 보다 비해서 오히려 작을 것이다.

빅데이터를 단기 숙제로 여겨서는 발전이 없다. 전문 인력 확보와 양성 프로그램 측면을 질적인 면 기준으로 따져 보면 최소 몇 년 이상 주요국에 비해 뒤져있고, 격차를 좁혀갈 기미도 보이지 않는 것이 사실이다. 빅데이터를 이끌어 갈 핵심인력들을 키울 새로운 유형의 진정으로 전문적인 프로그램이 필요하며, 이에 대한 장기적, 전략적 사고가 요청된다.

전용준 리비젼컨설팅 대표

저작권자 © 중부일보 - 경기·인천의 든든한 친구 무단전재 및 재배포 금지