중앙정부, '표준 생태계' 조성...선진국과 경쟁할 역량 키워야

우리 사회는 고도 정보화 사회를 지나 거대한 데이터가 도처에서 계속하여 생성되는 빅데이터 시대로 접어들었다. 선진국에 비해 늦은감은 있지만 우리 정부도 정부3.0과 빅데이터의 강력한 추진을 통해 일자리 창출과 국가 경쟁력 강화를 꾀하고 있다. 그 결과 중앙정부는 물론 지자체 및 공공기관까지 빅데이터가 급속도로 확산되고 있어 성과가 기대되고 있다. 또한, 수많은 정부보유 데이터가 공개되어 데이터 분석에 활용되고 있으며, 대학에서도 빅데이터 인력양성을 위한 프로그램 개발이 이루어지고 있어 빅데이터에 대한 기대가 커지고 있다.

그러나 정부 주도의 빅데이터 활용은 빅데이터 거버넌스(관리체계)와 함께 나갈 때 안전성이나 지속가능성이 보장될 수 있으나 현실은 그렇지 못하다. 빅데이터 거버넌스는 실시간으로 쏟아지는 빅데이터를 활용하여 성과를 창출하는 과정에서 요구되는 프라이버시 보호, 데이터의 품질과 표준화 문제, 데이터 수명관리, 메타 데이터와 마스터 데이터 관리, 데이터 관련 조직과 제도의 정비, 데이터 소유 및 관리권의 명확화 등 빅데이터에 관한 종합적인 관리체계를 다루는 분야이다. 자동차가 널리 활용되고 있는 현대 사회에서 자동차 관련 법규나 제도, 시설 및 이를 담당하는 조직과 인력이 없다면 어떻게 될 것인가 ? 빅데이터가 도처에서 매일같이 쏟아지는 상황에서 그 활용만 강조하고, 빅데이터 거버넌스가 소홀하다면 빅데이터 활용 성과가 지속되지도 않을 뿐 아니라 위험한 사회가 될 것이다.

빅데이터 거버넌스 없이 추진되는 빅데이터 활용이 얼마나 위험한지 좀 더 구체적으로 살펴보자. 빅데이터에는 개인의 프라이버시 정보가 필연적으로 포함된 경우가 많으며, 이를 적절히 관리하지 못하면 금융권의 개인정보 유출 사태나 빅브라더와 같은 우려가 현실화될 것이다. 또한, 빅데이터는 그 특성상 데이터 품질이 낮은 상태로 생성되어 유통되는 경우가 빈번하다. SNS 데이터나 IoT 데이터가 대표적인 사례이다. 이러한 데이터를 정제하지 않은체 분석하면 분석결과에 포함된 오류로 인해 중요한 의사결정에 활용할 수 없을 것이다. 특히 의료나 재난 분야의 빅데이터 활용에서 데이터의 품질 인증이나 측정 등에 대한 기준과 통제가 없이 빅데이터 분석결과를 활용하는 것은 곧바로 위험한 상황으로 직결된다. 폭증하는 데이터의 수명주기(lifecycle)를 제대로 관리하지 못하면 IT 비용 증가는 물론 각종 규제에 대응할 수 없을 것이다. 어떤 종류의 빅데이터는 국제규약으로 100년간 보존되어야 하는 경우도 있고, 데이터의 수명에 관한 규정은 데이터의 종류마다, 나라마다 다르게 제정되어 있다. 지난번 금융권 사태에서도 고객정보 수집과 활용만 있었지 보관 및 폐기에 관한 지침이 없거나 불완전하게 작동하여 더 많은 정보가 유출된 것으로 보인다. 그리고 빅데이터는 다양한 소스로부터 다양한 유형으로 발생하므로 메타 데이터 관리가 기존 데이터에 비하여 훨씬 복잡할 것으로 예상되고 있다. 메타 데이터는 데이터의 출처와 형식 및 통합방안 등 각종 데이터 관리를 위한 요약된 정보이고, 빅데이터의 경우 3Vs (크기, 다양성, 속도) 특징으로 인해 메타 데이터 관리가 훨씬 어렵기 때문이다. 이러한 빅데이터 관련 기술적인 문제가 완비되더라도 데이터 관련 문제를 전담하고 책임지는 조직과 인력 및 교육이 없다면, 또 구식제도가 살아 있다면 빅데이터의 효과는 지속되지 못할 것이며, 빅데이터가 확산될수록 위험성이 증가할 것은 자명한 일이다.

정부 및 지자체가 수행하고 있는 다양한 빅데이터 시범사업들이 빅데이터 거버넌스에 대한 이해가 부족한 채로 급하게, 단기 성과위주로 시행되어 안전성과 지속가능성을 확보하는 것이 중요한 과제이다. 빅데이터 거버넌스는 이미 IT 부서의 업무영역을 넘어 전사적으로 관심을 가져야 할 문제가 되고 있다. 선진국에서는 빅데이터 거버넌스 차원의 다양한 문제와 사례들이 수집되어 책으로 나오고 있으므로 각 조직의 CEO부터 빅데이터의 활용에 앞서 빅데이터 거버넌스에 대한 이해와 구축이 선행되어야 할 것이다. 빅데이터 관련 정부의 사업들이 담당공무원의 업무를 지속적으로 혁신하는데까지 이르지 못하면 예산낭비이고 장기적으로 빅데이터에 대한 경쟁력만 약화시킬 뿐이다. 정부의 빅데이터 인력양성 사업도 대학의 관련학과들을 변화시키지 못한다면 불꽃놀이에 불과한 것이다.

빅데이터 시대에 정부가 해야 할 시급한 일은 너무도 많다. 과도한 개인정보보호로 빅데이터 활성화에 걸림돌은 없는지, 또 빅데이터 활용으로 인해 프라이버시가 침해되지는 않는지 검증해야 한다. 기술적인 문제와 함께 제도적인 부문의 연구가 필요하다. 공개되는 수많은 공공데이터의 품질이 측정되고 관리되고 있는지도 지속적으로 확인하고 품질개선에 노력을 해야 한다. 개별 기관의 데이터가 아니라 이들을 통합할 때 문제가 많이 발생하므로 표준화가 중요한 것이다. 따라서 공개되는 공공데이터가 민간기업이 활용하기에 최적으로 되어 있는지 확인하고 품질이나 표준화 측면에서 지속적인 개선이 필요하다. 정부의 노력으로 공공 데이터가 공개되고는 있지만 내용이 부실하고, 표준화되지 않아 통합할 때 여러 가지 문제가 발생하고 있는 것이 현실이다. 그 데이터를 활용하는 수많은 기업들이 품질문제를 각자 고민하도록 두지 말고 정부가 한번에 품질문제를 해결하여 공개함으로써 민간의 반복되는 수고를 덜어주어야 한다. 그리고 빅데이터에 대한 메타데이터 관리를 통하여 빅데이터의 공유가 원활하게 이루어지도록 해야 하지만 아직 시작도 못하고 있다. 다양한 데이터가 쏟아지고 있으나 아직 무엇을 메타 데이터로 추출하여 관리해야 할지도 모르고 있는 것이다. 예를들어, 지자체마다 교통 빅데이터가 쏟아지고 있으나 이에 관한 메타데이터가 표준화되어 관리되고, 공개되지는 못하고 있다. 마지막으로 가장 중요한 것은 핀테크 사례와 같이 구식제도는 없는지, 빅데이터로 인해 조직의 변화관리가 잘 되고 있는지도 체크하는 일이다. 빅데이터 사업의 결과로 기존 업무의 혁신이 가능함에도 “기존 방식의 업무는 필수, 빅데이터 활용은 선택사항”이라는 현실에서 빅데이터가 내재화의 문턱을 넘지 못하고 있는 것이다.

이러한 빅데이터 거버넌스 측면의 일들은 국가적으로는 시급하고 중요하지만 민간이 나서서 하기는 적합하지 않다. 수익도 나지 않을 뿐 아니라 밖으로 드러나지도 않기 때문이다. 그래서 국가나 공공기관이 해야 할 일이며, 이를 통해서 빅데이터의 건전한 생태계 조성이 가능하고 지속가능한 빅데이터 성과를 통해 국가 경쟁력이 높아질 수 있을 것이다. 전국적으로 벌어지고 있는 시범사업들은 이제 정부나 지자체 보다는 민간이 시장 수요에 따라 하도록 맡겨두고 국가가 해야 할 빅데이터 거버넌스를 통한 생태계 조성에 힘을 쏟아야 할 것이다. 선진국 기업들과 경쟁해야 할 수많은 빅데이터 관련 기업들이 모호한 프라이버시 문제를 각자가 걱정해야 하고, 공공 빅데이터의 품질을 각자가 개선해야 하며, 구식제도를 각자가 걱정해야 하는 사회에서 빅데이터 경쟁력이 생길 수 있는가 ? 수많은 빅데이터 기업들이 빅데이터 기술개발과 비즈니스 활용에만 집중하여 선진국 기업들과 경쟁할 수 있도록 하는 생태계를 국가가 나서서 만들어야 할 것이다.

조완섭 충북대학교 비즈니스데이터융합학과 교수

저작권자 © 중부일보 - 경기·인천의 든든한 친구 무단전재 및 재배포 금지