칼럼

[이재관의 데이터 지식여행] 표준을 통해 데이터 서비스 품질 높이기

발행일시 : 2018-08-07 09:00
[이재관의 데이터 지식여행] 표준을 통해 데이터 서비스 품질 높이기

사람은 태어나기 전, 부모로부터 데이터가 생성(Create)되기 시작하여 세상에 태어나며 자신의 존재를 식별하는 데이터가 생성된다. 활동의 주체가 자신이 아니지만, 대상이 됨으로써 자신의 의지와는 별개로 자신에 대한 데이터가 생성된다. 생성된 자신의 데이터는 부모나 병원, 학교 등과 같이 활동의 주체가 보유하고 관리해 나간다.

자신이 원하든 원하지 않든 부모가 지어준 이름은 세상 사람들에게 공개된 자신을 식별하는 첫번째 데이터로 불려지게 된다. 아이가 성장하여 학교에 진학하고 보니, 같은 반 학생 중에 자신과 이름이 같은 학생이 있어 출석을 부를 때뿐만 아니라 학교 생활에 혼선을 가져온다. 우리가 생활하는 한 집단에서 각각의 객체를 식별할 수 있는 하나 이상의 데이터는 존재하게 되어있다. 하지만 식별하는데 시간이 오래 걸리거나 특별한 장치나 노력이 필요하다면 사람들은 불편해서 사용할 수가 없다.

옛날에는 사람의 이름을 작명하는 별도의 표준이 존재하지 않았고 관습에 의해 전통적으로 내려와 문화적인 범주에서 다루어져 왔다. 사람이 성장하며 활동 범위가 한 학교에서 사회로 넓어지고 비즈니스를 위해 세계로 확장이 되면서 명명 표준에 영향을 받게 된다. 사람뿐만 아니라 세상에 태어나서 존재하는 모든 사물은 이름을 부여하여 불려지게 되어 있다. 이때 이름을 짓는 규칙은 그 사물이 존재하는 산업 도메인의 범주(Category)에 따르고 그 범주 안에서 유일한 객체로 식별이 가능해야 한다.

세상에 점점 더 많은 객체가 태어나며 사람들은 유일하게 식별할 수 있는 데이터를 정하려고 한다. 특히 국가가 형성되며 통치 활동을 해나가는 정부기관은 국가내 존재하는 사람들을 식별하기 위해 중첩하지 않는 데이터 찾거나 몇 개의 데이터를 구성하여 식별하려고 한다. 좋은 예는 대한민국 내에 존재하는 국민을 식별하기 위해서 생성한 ‘주민번호’이다. 자연적으로 생성된 데이터(개체에 대한 기본 속성 Basic Attribute)를 결합하여 식별자를 정의할 경우에는 변형없이 그대로 사용하는 것이 원칙이다.

[이재관의 데이터 지식여행] 표준을 통해 데이터 서비스 품질 높이기

기본 데이터를 변형하여 식별자를 구성했을 때, 중첩(duplicate)가 발생하여 식별 기능을 상실하게 된다. 데이터 정의에 대한 기본 원칙인 ‘데이터 표준(Data Standard)’을 준수할 때 데이터에 대한 품질을 보장할 수 있다. 데이터 표준은 데이터를 공유(Sharing)하고 이용하는 집단간의 상호운용성 (Interoperability)을 높여준다. 품질 높은 데이터 서비스(DaaS)를 가능하게 하는 주요 요소는 데이터 표준이다.

데이터 표준은 데이터를 공유하고 상호운용하는 산업 분야별로 정의하여 데이터 식별(Data Identifying) 및 데이터 교환(Data Interchange) 등을 품질 높게 수행하도록 한다. ACS(Accredited Standards Committee) X12는 의료, 보험, 운송, 공급 망(Supply Chain) 등에서 전자 데이터 교환(Electronic Data Interchange) 표준으로 널리 사용하고 있다. 의료분야에서는 HL7(Health Level Seven)이 전자 건강 정보를 교환, 통합, 공유, 검색하는 프레임워크로 자리를 잡았고 SWIFT(Safety for Worldwide Interbank Financial Telecommunication)는 금융 산업 분야에서 재무 프랜잭션을 표준화하고 자동화했다.

데이터 서비스(DaaS)에서 데이터 표준은 데이터 품질을 위한 기준이고 틀(Framework)을 제공하지만 데이터 품질을 확보하기 위해서는 특별하고 지속적인 노력이 필요하다. 인간이 자신의 건강을 유지하기 위해서 정기적으로 건강 검진을 받고 검사 결과를 토대로 조치 활동을 해 나가듯이 데이터도 정기적인 건강 검진(Health Check)과 감사(Audit)를 수행해야 한다. 끊임없는 데이터 스튜와드(Steward) 활동에 내재화(Internalization)하여 검사 및 감사 결과를 반영하고 데이터를 정화(Cleanse)해 나가야 한다.

세상의 데이터는 생성된 후에 시간이 지날수록 생성 주체자의 활동 범위에 따라 영향성이 넓어져서 복귀(Rollback)하는데 비용이 많이 든다. 그래서 데이터가 생성되기전에 데이터를 정의하고 모델을 만들어서 표준을 정의하는 활동은 대단히 중요하다. 비즈니스 활동을 수행하는 기업과 정부기관 등은 데이터의 생성자(Creator)이며 데이터 서비스(DaaS) 공급자로서 데이터 표준을 정립하고 데이터 품질관리 활동을 수행해야 하는 책임을 가진다.

결론적으로 데이터 서비스 공급자는 품질 높은 데이터 서비스를 제공하기 위해서 데이터 아키텍처 수립과 데이터 모델링을 통해 데이터 품질의 기준인 데이터 표준을 정립하고 끊임없는 데이터 스튜와드 활동을 수행해 나가야 한다. 데이터 품질을 위한 끊임없는 데이터 스튜와드 활동은 데이터의 주체인 고객에 대한 관심과 정성으로 비롯되며 책임을 통해 완성된다. 이제 4차 산업혁명을 위해 데이터 서비스(DaaS) 체제를 혁신해야 할 때가 왔다.

이재관 objectjk@gmail.com 필자는 30년 전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 2년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

(*이 칼럼은 Nextdaily의 편집방향과 다를 수 있습니다.)

© 2018 nextdaily.co.kr 무단전재 및 재배포금지

(주)넥스트데일리 | 등록번호 : 서울 아 01185 | 등록일 : 2010년 03월 26일 | 제호 : 넥스트데일리 | 발행·편집인 : 구원모
서울시 금천구 가산디지털2로 123, 701호ㅣ발행일자 : 2005년 08월 17일 | 대표전화 : 02-6925-6318 | 청소년보호책임자 : 나성률

Copyright © Nextdaily. All Rights Reserved