이제는 데이터 시대로 데이터의 활용이 기업 경쟁력 최우선 요소가 됐다. 데이터가 폭증하는 가운데 제대로 된 데이터 활용이 기업 비즈니스를 성공으로 이끄는 핵심요소가 됐다. 기업들은 앞을 다투어 빅데이터 분석 솔루션을 도입하고 있지만 각 단계별로 솔루션이 달라 데이터 통합분석이나 효율성이 떨어지는 문제가 있다.

하버드 비즈니스 리뷰(Harvard Business Review)의 발표에 따르면, 기업들은 비즈니스 의사결정 시 자사의 데이터 중 50% 미만의 정형 데이터와 1% 미만의 비정형 데이터만을 활용하는 것으로 나타났다. 이제 기업이 비즈니스에서 성공하려면 방대한 양의 정형 및 비정형 데이터에 대한 간편하고도 신속한 분석이 필요하다.

따라서 기업들은 빅데이터 활용을 위해 데이터 수집부터 시각화까지 하나의 워크플로우로 구현되는 통합 빅데이터 처리 및 분석 플랫폼 구축이 절실해졌다.

최근 통합 데이터 처리 및 분석 플랫폼 중에 효성인포메이션시스템의 ‘펜타호’가 주목받고 있다. 펜타호(Pentaho)는 100% GUI 기반 간편한 환경의 데이터 수집 및 통합부터 머신러닝 모델 구축, 모델 기반 고급 분석, 모델 업그레이드, 시각화 및 리포팅을 모두 제공하는 업계 유일의 히타치 밴타라의 원스톱 빅데이터 분석 플랫폼이다.

통합 데이터 처리 및 분석 플랫폼 효성인포메이션시스템 ‘펜타호’
통합 데이터 처리 및 분석 플랫폼 효성인포메이션시스템 ‘펜타호’

펜타호는 다양한 빅데이터 사용자 업무 자동화를 지원한다. 데이터 통합, 머신러닝 기반 분석, 대시보드 및 시각화를 통해 GUI 기반 데이터 전처리, 분석 및 예측 모형, 고객 맞춤형 대쉬 보드로 데이터 엔지니어, 데이터 분석가와 과학자, 비즈니스 분석가 및 고객 등 다양한 사용자의 업무 자동화를 지원한다.

다양한 데이터 소스를 빠르고 편리하게 통합할 수 있다. 복잡한 코딩 필요없이 GUI 환경에서 쉽게 데이터를 드래그 앤 드롭으로 빠르게 통합한다.

빅데이터 처리 및 통합 효율성이 높다. 정형 데이터뿐 아니라 텍스트, 음성, 이미지, 영상 등 비정형 데이터 등 다양한 데이터 소스로부터 데이터를 통합하는 과정을 직관적인 워크플로우 관리로 운영관리 효율성을 높아진다. 데이터추출, 데이터 변형/추출, 데이터 병합, 데이터 집계, 데이터 적재 등의 단계를 소스테이블, 업무규칙, 타겟 데이블로 관리해 효율성을 높였다. 병렬처리, 서버 클러스터링, 코딩을 줄이고 AEL(Adaptive Execution Layer)로 빅데이터 처리 속도도 높였다.

머신 러닝 시스템 운영도 자동화됐다. 머신러닝에 사용되는 R, 파이썬, 스파크(Spark) MLlib 및 웨카(Weka) 등 오픈소스 도구를 이용해 분석 모델을 개발하고, 고급 분석을 수행할 수 있다. 사용자들은 코딩 또는 스크립팅 작업 없이 쉽게 드래그 앤 드롭만으로 머신러닝 기술이 접목된 분석 라이브러리를 적용해 모델을 개발하고, 테스트를 거쳐 최적의 결과를 도출하는 모델을 선택할 수 있다. 새로운 데이터 적재에 따른 모델 업그레이드를 워크플로우로 생성하고 자동화하여 데이터의 실시간 변화에 따라 최상의 정확도를 지닌 모델로 신속하게 개선할 수 있도록 한다.

데이터 기반 실시간 의사결정도 지원한다. 시각화 및 리포팅을 위한 인터랙티브 웹 인터페이스를 통해 인사이트를 실시간으로 공유 및 업데이트할 수 있다. 다양한 차원의 데이터 분석을 위해 지리적 맵, 히트 그리드, 버블 차트 등의 시각화 라이브러리와 모바일 환경을 지원한다. 모든 애플리케이션에 분석, 데이터 시각화, 인터랙티브 리포팅, 애드혹 분석 및 맞춤형 대시보드를 임베딩하여 다양한 애플리케이션에서 생성되는 풍부한 인사이트를 기반으로 의사결정을 내릴 수 있도록 지원한다.

펜타호는 다양한 산업에서 IT 자산의 가용성과 효율성, IT 운영의 보안성과 편리성을 높이고 비용을 줄이고 있다. 제조, 헬스케어, 금융, 반도체, 모빌리티, 자원, 화학, 철도 및 교통 등 다양한 산업 분야의 빅데이터 플랫폼에 속속 적용되고 있다.

조항준기자 jhj@nextdaily.co.kr

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지