자연관찰 카드뉴스
칼럼

[이재관의 데이터 품질 톺아보기] 데이터 결함 방지하기

발행일시 : 2019-02-11 00:00
[이재관의 데이터 품질 톺아보기] 데이터 결함 방지하기

사람들은 자신이나 식구가 아프다고 느낄 때 병원을 찾는다. 의사를 만나서 먼저 어디 아픈지에 대해 설명한다. 환자로부터 증상을 들은 의사는 원인을 찾기 위해 환자가 최근에 무슨 활동(Activity)을 했는지 확인한다. 환자의 최근 활동을 근거로 나타난 증상에 대한 원인을 파악하고 치료를 위한 처방을 내린다. 처방은 환자의 상태를 감안하고 병의 시급성과 경중을 따져서 치료 기간을 정하고 실시한다.

환자가 의사에게 설명한 증상은 자신의 몸에 나타난 현상 데이터로 의사는 진찰을 통해 보다 정확성이 높은 데이터를 확보한다. 의사는 문진을 통해 환자의 최근 활동 결과 데이터와 연계 분석하여 원인을 도출하고 치료를 위한 처방을 내린다. 환자가 아픈 원인은 최근 활동의 결과로 상호 연관 작용 (Interaction)을 통해 얻어진 활동에 대한 결함(Defect)이다. 활동에 대한 결함은 결과인 데이터 결함으로 환자의 증상과 같이 나타난다.

의사는 체온이 높은 환자에게 해열제를 투약하라는 처방을 내린다. 의사가 처방한 해열제는 환자의 열을 내리게 하는 조치이고 곧 데이터 결함을 지금 당장 고쳐서 정상적인 체온 데이터를 얻는 데이터 클린징(Data Cleansing, 추후 칼럼에서 다뤄질 예정)과 같은 역할을 한다. 환자에게 시급하고 중한 처방은 고치는 활동을 즉시 수행해야 하지만, 활동 결함 즉, 데이터 결함이 발생하지 않도록 미연에 방지하는 조치는 장기적으로 수행해야 한다.

몸이 아팠던 환자가 약을 먹고 병이 나은 후에 자신의 건강을 회복하기 위해 정기적으로 운동하는 활동은 활동과 데이터 결함을 방지하기 위한 장기적인 조치이다. 데이터 결함을 방지하는 방법은 자신의 활동을 개선(Improvement)하여 활동 결함이 발생하지 않도록 노력해야 한다. 활동의 기본단위인 프로세스를 모형(Model)으로 정립하고 프로세스 수행 결과인 데이터를 세심하게 관찰(Monitoring)하고 분석하여 프로세스를 개선해 나가야 한다.

[이재관의 데이터 품질 톺아보기] 데이터 결함 방지하기

우리에게 잘 알려진 PDCA(Plan-Do-Check-Act)는 월터 슈하트(Walter Shewhart)가 개발한 슈하트 주기(The Shewhart Cycle)로 프로세스 개선(Process Improvement) 기법이다. PDCA의 네 단계는 아주 간단하다.

1. 계획(Plan) : 나타난 문제를 정의하고 원인을 분석하여 변화하기 위한 목표 정하고 개선을 위한 일정을 정한다.
2. 실시(Do) : 통제된 환경 내에서 개선 활동을 수행한다.
3. 점검(Check) : 개선 활동 결과인 데이터를 목표와 대비하여 평가한다.
4. 시행(Act): 개선 사항을 ‘표준화’하여 지속적으로 활동한다.
슈하트 주기는 일본에서 품질 분야의 대가인 에드워드 데밍(Edward Deming)에 의해 데밍 주기(Deming Cycle)로 프로세스 품질을 개선하는 기법으로 널리 사용되었다.

개인적 데이터 결함을 방지하기 위한 프로세스 개선은 습관이나 버릇을 고치듯이 단순하게 계획하고 실시하고 결과 데이터를 평가하여 점검하고 생활 규칙으로 정하여 지속적으로 시행하면 된다. 프로세스 간의 의존관계(Dependency)가 복잡하고 프로세스를 작동하는 이벤트가 다양한 기업에서는 한, 두 개 정도 프로세스를 개선하는 접근이 아니라, 시스템(System, 친화성 높은 프로세스들의 결합) 단위로 수행한다.

결함 데이터가 발견되거나 이상 징후 데이터가 나타나면 그 데이터의 생명주기(Lifecycle)에 관여하는 프로세스를 지명한다. 그리고 프로세스를 포함하고 있는 비즈니스 시스템의 이벤트 의존도(Event Dependency Diagram)를 통해 의존관계가 있는 프로세스를 개선 대상으로 정의하고 계획(Plan)을 수립한다. 개선 사항을 반영한 프로세스를 수행(Do)하고 수행 결과 데이터를 평가(Check)한다. 평가 결과를 반영하여 개선사항을 표준화하고 지속적으로 시행(Act)한다.

데이터 결함을 발견한다는 것은 사람이 자신의 건강에 관심을 가지고 자신 상태를 느끼거나 지속적으로 관찰하고 있을 때 가능하다. 기업은 사람으로 구성된 조직체로서, 각 구성원이 기업의 건강 상태에 관심을 가지고 지속적으로 관찰할 때 데이터 결함을 발견할 수 있다. 기업 데이터 결함은 비즈니스 프로세스 결함으로 인해 발생하는 것으로 프로세스를 수행하는 직원이 세심한 관찰과 개선을 위한 노력을 경주해야 한다.

우리 주변에 다가오고 있는 4차 산업혁명은 어느 날 아침에 깜짝 다가오는 것이 아니라, 우리 모두 프로세스 결함을 개선하여 데이터 결함을 방지하는 세심한 관심과 관찰을 통해 한 단계, 한단계 개선해 나가야 이루어질 수 있음을 다시 한번 깨닫는다.

이재관 objectjk@gmail.com 필자는 30년 전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 3년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

© 2019 nextdaily.co.kr 무단전재 및 재배포금지

NextDaily 집중분석

(주)넥스트데일리 | 등록번호 : 서울 아 01185 | 등록일 : 2010년 03월 26일 | 제호 : 넥스트데일리 | 발행·편집인 : 구원모
서울시 금천구 가산디지털2로 123, 701호ㅣ발행일자 : 2005년 08월 17일 | 대표전화 : 02-6925-6318 | 청소년보호책임자 : 나성률

Copyright © Nextdaily. All Rights Reserved