자연관찰 카드뉴스
칼럼

[이재관의 데이터 품질 톺아보기] 리파지토리로 데이터 프로파일링하기

발행일시 : 2019-03-22 00:00
[이재관의 데이터 품질 톺아보기] 리파지토리로 데이터 프로파일링하기

사람이 머물며 편안히 살 수 있는 집을 짓거나 이곳저곳을 다닐 수 있는 자동차를 만들 때는 기능을 발휘하는 구조체에 대한 정의를 설계한다. 완성될 제품에 대한 설계도는 결과적으로 얻는 완성된 모습뿐만 아니라, 만드는 과정에서 어떤 활동을 해야 하는 지까지 모든 과정을 담고 있다. 설계도가 제품 그 자체를 나타내고 품질을 결정하는 기준이라 할 수 있다.

제품(Product)을 구성하는 부품 하나하나에 대한 상세한 정의와 설명해 놓은 것을 한 차원 높은 제품으로 메타-데이터라 부른다. 제품을 구성하고 있는 부품과 부품을 어떻게 조립해야 하는 가하는 활동은 실제 제품 하나 하나를 만들어 내기 전에 설계 작업을 통해 정의하고 작업 결과(Deliverable)인 메타-데이터는 리파지토리(Repository)라는 저장소에 담는다.

리파지토리에 담겨진 설계도는 제품을 만드는 과정에 주로 품질 높은 완성된 제품을 위한 기준으로 삼지만, 고객이 제품을 이용하는 중에 고장이 발생하여 수리할 때 중요한 지침이 된다. 특히 기존 제품을 혁신적으로 개선하여 고객에게 더 나은 가치를 전해주려고 할 때, 제품에 대한 정의와 설명, 조립 방법 등을 담고 있는 리파지토리는 더욱 중요한 역할을 한다.

우리가 편리하게 사용하는 자동차나 모바일 폰과 같은 수많은 부품으로 구성된 제품들은 세계 유수 기업이 생산했더라도 완벽하지는 못하다. 드물지만, 아주 가끔 제품 설계상의 하자로 제품의 고장이 예상되어 사고가 발생하기 전에 회수(Recall)하여 무상으로 수리하기도 한다. 이때 리파지토리에 담겨있는 제품에 대한 상세한 정의와 부품 조립 과정에 대한 설명 등은 제품 하자를 수리하는 기준이 된다.

제품에 대한 정의와 부품 조립 방법 등을 리파지토리를 통해 다시 확인하고 검토하여 하자를 발견하고 하자에 대한 현상 및 수리 방법 등을 정리해 놓은 것을 프로파일링(Profiling)이라 한다. 제품 하자에 대한 현상과 조치 방법을 담고 있는 전 과정을 데이터 프로파일링(Data profiling)이라 부르지만, 리파지토리와 같이 하자에 대한 조치 방법도 함께 담고 있다.

[이재관의 데이터 품질 톺아보기] 리파지토리로 데이터 프로파일링하기

리파지토리와 데이터 프로파일링은 제품을 생산하여 고객에게 가치(Value)를 전해주는 기업에게는 고객의 신뢰를 유지하기 위해서 굉장히 중요한 요소이다. 사건에 대해 변론하는 로펌이나 기업이 가지고 있는 문제를 해결하는 솔루션을 자문하는 컨설팅 기업도 리파지토리와 데이터 프로파일링은 똑같이 중요하다. 고객에게 제품이나 서비스 가치를 창조하여 전해 주는 모든 기업이 갖추어야 하는 한 차원 높은 메타-데이터 리파지토리이다.

4차 산업혁명을 통해 고객 개개인에게 차별화된 제품이나 서비스 가치를 전해주려고 노력하는 기업은 우선적으로 갖추어야 하는 리파지토리이고 데이터 프로파일링이다. 자신이 창조하는 제품이나 서비스 가치에 대한 정의하고 이 가치를 생산하기 위해 무슨 활동을 수행해야 하고 그 결과인 데이터가 무엇인지에 대한 설명을 저장해야 한다. 우리가 가치를 창조하는 활동이 잘 수행되었는지 즉 활동 결과인 데이터 품질을 보증할 수 있는지에 대한 기준이 된다.
 
4차 산업혁명을 일으키자고 외치고 있는 우리 기업들은 현재 리파지토리를 갖추고 있는가?

잘 나가고 있는 우리 기업이 리파지토리를 갖추는 길은 그리 쉽지는 않다. 날아가는 비행기의 엔진을 수리하거나 살아 숨쉬는 사람의 뇌를 수술하는 것과 같이 생사를 넘나드는 혁신적 노력이 필요하다. 앞으로 고객에게 전해줄 제품이나 서비스의 가치를 새롭게 정의하고 그 가치를 만들기 위한 활동과 활동에 대한 결과인 데이터를 정의해야 한다.

기업의 비즈니스 아키텍처와 정보 아키텍처를 정립하는 대단히 중요한 프로젝트를 수행하며 아키텍처부터 완성품이 창조되는 순간까지 전 산출물을 담아야 한다. 한 차원 높은 데이터베이스인 기업의 브레인과 같은 리파지토리는 기업이 최초 태어나면서 갖추는 것이 바람직하다. 4차 산업혁명을 이끌어 나갈 기업이라면 지금이 바로 리파지토리를 갖추고 새로이 태어나야 할 시점이 아닐까 한다.    

이재관 objectjk@gmail.com 필자는 30년 전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축  프로젝트를 위한 컨설팅을 수행하였다. 최근 3년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

© 2019 nextdaily.co.kr 무단전재 및 재배포금지

NextDaily 집중분석

(주)넥스트데일리 | 등록번호 : 서울 아 01185 | 등록일 : 2010년 03월 26일 | 제호 : 넥스트데일리 | 발행·편집인 : 구원모
서울시 금천구 가산디지털2로 123, 701호ㅣ발행일자 : 2005년 08월 17일 | 대표전화 : 02-6925-6318 | 청소년보호책임자 : 나성률

Copyright © Nextdaily. All Rights Reserved