데이터 분석 기획의 이해

01. 분석 기획 방향성 도출

  • 분석 대상과 방법 : 4가지 유형을 넘나들며 분석을 수행
방법 \ 대상 Known UnKnown
Known 최적화 (Optimization) 통찰(Insight)
UnKnown 솔루션 (Solution) 발견 (Discovery)

 

  • 분석 기획 방안
  과제 중심적 접근 장기적 마스터 플랜
목적 빠르게 해결 지속적 분석 원인 해결
1차 목표 Speed & Test Accuracy & Deploy
과제 유형 Quick & Win Long Term View
접근 방식 Problem Solving Problem Definition

 

  • 분석 기획시 고려사항
가용데이터 적절한 유스케이스 탐색 장애요소에 대한 사전계획 수립
분석의 기본이 되는 데이터 확보 / 파악 기존에 잘 구현되어있는 유사 시나리오 활용 조직의 역량으로 내재화

 

  • 의사결정을 가로막는 요소
    • 고정관념, 편향된 생각
    • 프레이밍 효과 : 동일 상황임에도 개인의 판단, 결정이 달라짐

 

 

02. 분석 방법론

  • 분석 방법론의 구성요소
    • 절차, 방법, 도구와 기법, 템플릿과 산출물

 

  • 분석 방법론의 모델
계층적 프로세스 모델 단계(Baseline로 관리) → 태스크 → 스탭(단기간 수행 WorkPackage)
폭포수 모델 이전 단계 완료되어야 다음 단계 진행 (Top-Down)
나선형 모델 여러 개발과정 거쳐 점진적으로 완성. 위험요소 제거에 초점
프로토타입 모델 일부분(프로토 타임)을 우선 개발하고 보완
반복적 모델 - 증분형 모형 : 전체 시스템을 작은 단위로 나누어 개발
- 진화형 모형 : 핵심 부분을 개발한 후 요구사항을 반영하여 진화
애자일 짧은 개발 주기를 가지고 고객 피드백을 지속적으로 반영하여 반복적인 개발

 

  • KDD 분석 방법론
데이터 선택 → 전처리 → 변환 → 마이닝 → 결과평가
원시데이터(Raw Data)나
DB에서 필요한
데이터 선택
이상값, 잡음 식별 및
데이터 가공
변수 선택 및 차원 축소 알고리즘을 선택하여
분석 수행
결과에 대한 해석, 결과가
충족되지 않으면
절차 반복 수행

 

  • Crisp-DM 분석 방법론
업무 이해 데이터 이해 데이터 준비  모델링  평가 전개
업무 목적 파악
상황파악
목표 설정
프로젝트 계획 수립
초기 데이터수집
기술분석
EDA
데이터 품질 확인
데이터 셋
선택 및
정체 통합
모델링 기법 선택
테스트 계획 설계
모델 작성 및 평가
분석 결과 평가
모델링 과정 평가
모델 적용성 평가
전개계획
모니터링 및 유지보수 계획 수립
프로젝트 종료 보고서 작성
프로젝트 리뷰

 

  • SEMMA 분석 방법론
Sample Explore Modify Model Assess
 분석 대상 데이터 추출 탐색하고 오류 확인 데이터의 변환 알고리즘 적용 모델의 평가 및 검증

 

  • 빅데이터 분석 방법론

03. 분석과제 발굴

  • 하향식 접근 방법
    • 문제가 주어지고 해답을 찾기 위해 진행
문제탐색 - 빠짐없이 문제를 도출하고 식별하며 솔루션 초점보다는 가치에 초점
- 비즈니스 모델 캔버스 단순화 측면 : 업무, 제품, 고객, 규제와 감사, 자원 인프라
 - 관점 : 거시적 관점 (사회, 기술, 경제, 환경, 정치)
             경제 확대 관점 (대체자, 경쟁자, 신규 진입자), 시장의 니즈 탐색 관점 (고객, 채널, 영향자)
문제 정의 - 비즈니스 문제를 데이터 문제로 변환하여 정의
해결방안 - 기존 시스템 활용, 시스템 고도화, 인적 자원 확보, 아웃소싱 등
타탕성 검토 - 경제적 타당성 : 비용대비 편익 분석 관점 접근
- 데이터 타당성 : 데이터 존재 여부, 분석 역량이 필요
- 기술적 타당성 : 역량 확보 방안 사전에 수립

 

  • 상향식 접근 방법
    • 문제 정의 자체가 어려울 때, 사물을 그대로 인식하는 What 관점
    • 주로 비지도 학습 활용

 

  • 혼합 접근 방법
    • 발산단계 : 상항식 접근 방법으로서, 가능한 방안들을 도출
    • 수렴단계 : 하향식 접근 방법으로서, 도출된 방안들을 분석

 

  • 디자인 싱킹
    • 사용자에 공감으로 시작해서 아이디어 발산/수렴 과정을 통한 피드백으로 발전하는 과정
    • 공감하기 → 문제정의 → 아이디어 도출 → 프로토타입 → 테스트

 

  • 지도학습, 비지도학습
지도학습 비지도학습
정답이 있는 데이터를 학습 (하향식 접근법) 정답이 없는 데이터를 학습 (상향식 접근법)
분류분석, 회귀분석, 의사결정트리, KNN, SVM 군집분석, 자원축소, 연관규칙분석

 

 

04.분석 프로젝트 관리 방안

  • 분석 과제에서 고려해야할 5가지 요소
    • 데이터 크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도 (이건 Trade-Off 관계 + 오류분표의 평가지표와 다른 개념)

 

  • 프로젝트 관리 지식 체계 10가지 영역
    • 통합, 범위, 시간(일정), 원가, 품질, 인적자원, 의사소통, 리스크(위험), 조달(아웃소싱), 이해관계자

 

분석 마스터 플랜 

01. 마스터 플랜 수립

  • IT 프로젝트의 우선순위 선정 기준
    • 중장기 마스터 플랜 수립을 위해 ISP 활용
      1. 전략적 중요도 : 전략적 필요성, 시급성
      2. 실행 용이성 : 투자 용이성, 기술 용이성

 

  • 데이터 분석 프로젝트의 우선순위 선정 기준
시급성 관점 난이도 관점
비즈니스 효과 (Return) - Value 투자 비용 요소 (Investment) - Volume, Variety, Velocity
시급성 중요시 : 3 → 4 → 2 난이도 중요시 : 3 → 1 → 2

 

 

02. 분석 거버넌스 체계 수립

  • 분석 거버넌스 체계 구성요소
    • 조직, 프로세스, 시스템, 데이터, 분석 관련 교육 및 마인드

 

  • 데이터분석 수준 진단
    • 분석 준비도
분석적 업무파악 인력 및 조직 분석기법
발생한 사실 분석 업무
예측 분석 업무
시뮬레이션 분석 업무
분석 업무 정기적 개선
분석 전분가 직무 존재
분석 전문가 교육 훈련 프로그램
관리자들의 기본적 분석 능력
전사 분석 업무 총괄 조직 존재
경영진 분석업무 이해능력
업무별 적합한 분석기법 사용
분석 업무 도입 방법론
분석 기법 라이브러리
분석기법 효과성 평가
분석 기법 정기적 개선
분석 데이터 분석 문화 IT 인프라
분석 업무를 위한 데이터 충분성
분석 업무를 위한 데이터 신뢰성
분석업무를 위한 데이터 적시성
비구조적 데이터 관리
외부 데이터 활용 체계
마스터 데이터 관리 (MDM)
사실에 근거한 의사결정
관리자의 데이터 중시
회의 등에서 데이터 활용
경영진의 직관보다 데이터
데이터 공유 및 협업 문화
운영시스템 데이터 통합
EAL, ETL 등 데이터 유통체계
분석 전용 서버 및 분석환경
빅데이터 분석환경
통계분석 환경
비주얼 분석 환경

 

  • 분석 성숙도
    • CMMI 모델 기반 (1~5 단계)
단계 비즈니스부분 조직 및 역량부문 IT 부문
도입
: 환경,
  시스템 구축
실적 분석 및 통계
정기 보고 수행
운영 데이터 기반
일부 부서에서 수행
담당자 역량에 의존
데이터 웨어 하우스
데이터 마트
ETL / EAI, OLAP
활용
: 업무에 적용
미래결과 예측
시뮬레이션
운영 데이터 기반
전문담당부서 수행
분석 기법 도입
관리자가 분석 수행
실시간 대시보드
통계분석 환경
확산
: 전사 차원 관리, 공유
전사성과 실시간 분석
프로세스 혁신 3.0
분석규칙관리
이벤트 관리
전사 모든 부서 수행
분석 CEO 운영
데이터 사이언티스트 확보
빅데이터 관리 환경
시뮬레이션 / 최적화
비주얼 분석
분석 전용 서버
최적화
: 혁신,
성과향상에 기여
외부 환경 분석 적용
최적화 업무 적용
실시간 분석
비즈니스 모델 진화
데이터 사이언스 그룹
경영진 분석 활용
전략 연계
분석 협엽 환경
분석 Sand Dox
프로세스 내재화
빅데이터 분

 

  • 데이터 분석 성숙도 모델

 

  • 분석 지원 인프라 방안 수립
    • 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)
    • 분석 플랫폼 구성 요소 (광의가 협의를 포함하는 개념)
광의의 분석 플랫폼 협의의 분석 플랫폼
분석 서비스 제공 엔진, 분석 어플리케이션, 분석 서비스 API, 하드웨어 데이터 처리 프레임 워크, 분석엔진, 분석 라이브러리

 

  • 데이터 거버넌스
    • 전사 차원에서 데이터에 대해 표준화된 관리체계 수립
    • 구성요소 : 원칙, 조직, 프로세스
    • 중요 관리 대상
마스터 데이터 메타 데이터 데이터 사전 
자료 처리에 기준이 되는 자료 다른 데이터를 설명해주는 데이터 DB에 저장된 정보를 요약

 

  • 데이터 거버넌스 체계
데이터 표준화 데이터 관리체계 데이터 저장소 관리 표준화 활동
메타 데이터 및 사전 구축 효율성을 위함 저장소 구성 모니터링, 표준 개선 활동

 

  • 빅데이터 거버넌스
    • 데이터 거버넌스 체계 + 빅데이터 효율적 관리, 데이터 최적화, 정보보호, 데이터 카테고리 별 관리책임자 지정 등 포

'혼자 끄적끄적 > ADsP' 카테고리의 다른 글

ADsP | 1. 데이터의 이해 - 요약  (7) 2025.06.22
ADsP | 1. 데이터의 이해  (0) 2025.06.22

+ Recent posts