Ming's Life

[내일배움캠프] 3일차 본문

내일배움캠프

[내일배움캠프] 3일차

chamiii 2025. 5. 14. 16:59

1. 오늘 학습 키워드

  • 데이터 리터러시

 

2. 오늘 학습 한 내용을 나만의 언어로 정리하기

 

데이터 리터러시

  • 데이터를 읽는 능력
  • 데이터를 이해하는 능력
  • 데이터를 비판적으로 분석하는 능력
  • 결과를 의사소통에 활용할 수 있는 능력

 

데이터 분석에 대한 착각

  • 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각
  • 데이터를 잘 가공하면 유용한 정보를 얻을 수 있다고 생각
  • 분석에 실패하면 방법론, 스킬이 부족한 것이라고 생각

 

심슨의 역설 (Simpson’s Paradox)

  • 심슨의 패러독스란 '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 말한다.
  • 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것은 아님
  • 데이터에 기반한 결론이라고 해서 이를 맹목적으로 받아들여서는 안됨

시각화를 활용한 왜곡

  • 자료의 표현 방법에 따라서 해석의 오류 여지가 존재

샘플링 편향 (Sampling Bias)

  • 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생
  • 표본이 편향되면서 실제와는 다르게 해석하게 될 수 있음

상관관계와 인과관계

  • 상관관계
    • 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미
    • 파악 방법은 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름
  • 인과관계
    • 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미
    • 원인과 결과가 명확한 것

데이터 리터러시가 필요한 이유

  • 크게 3가지 단계로 구분
    • 문제 및 가설정의
    • 데이터 분석
    • 결과 해석 및 액션 도출
  • 위 단계 중 ‘생각’이 주요한 단계에서 데이터 리터러시가 필요
  • 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함

 

문제 정의

 

문제 정의

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 설정

문제 정의 방법론

- MECE (Mutually Exclusive, Collectively Exhaustive)

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
  • MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

- 로직 트리(Logic Tree)

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음

 

데이터 유형

 

정성적 데이터 (Qualitative Data)

  • 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함
  • 대부분 텍스트, 비디오, 오디오 형태로 존재
  • 정형되지 않고 구조화 되어있지 않는다.
  • 데이터를 구조화하기 어렵다.
  • 새로운 현상이나 개념에 대한 이해를 심화하는데 사용

정량적 데이터 (Quantitative Data)

  • 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있다.
  • 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉽다.
  • 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있다.
  • 지표로 만들기에 용이
  • 설문조사, 실험, 인구 통계, 지표 분석 등에 활용

 

지표 설정

지표

  • 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제에 대해 정확하게 파악하기 위해서 필요

지표정리

 

 

Retention Ratio

- N-Day 리텐션

  • 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
  • 일반적으로 사용하는 리텐션 지표는 N-Day 리텐션
  • 게임, 소셜 등 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합
  • 유저가 Active User로 집계된 최초 날을 Day 0으로 설정
  • Day 0에 액티브 상태가 된 모든 유저들의 N일차 리텐션을 계산
  • N-Week, N-Month도 가능

- Unbounded 리텐션

  • 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
  • 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
  • 유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
  • 해석: Day5는 5일차 이후에 한 번 더 들어온 유저의 비율
  • Unbounded 리텐션은 이탈률의 반대 개념

- Bracket 리텐션

  • 설정한 특정 기간을 기반으로 재방문율을 측정
  • Bracket 리텐션은 N-Day 리텐션을 확장한 개념 > 일/주/월 단위가 아닌 지정한 구간으로 나눔
  • 1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차)
  • 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석

Funnel

  • 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
  • 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
  • 모든 서비스와 비즈니스는 각 단계로 갈 수록 이용자 수가 줄어들게 됨
  • 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정

AARRR

  • 디지털 마케팅시 퍼널을 활용하는 프레임워크
  • 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
    • Acquisition: 유입
    • Activation: 활성화
    • Retention: 재방문(재구매)
    • Revenue: 수익
    • Referral: 추천

LTV (Life Time Value, 고객 평생 가치)

  • 당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
  • 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
  • LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
  • LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것

북극성 지표

  • 제품/서비스의 ‘성공’을 정의
  • 제품/서비스가 유저에게 주는 core value를 가장 잘 나타낸 것
  • 장기 성장을 위해 필수적으로 모니터링 해야 함
  • 제품/서비스 전략의 핵심
  • 유저/고객이 제품/서비스에서 느끼는 가치
  • 회사의 사업 목표를 나타내는 지표 중 선행지표 (후행X)

* 북극성 지표가 중요한 이유

  • 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시
  • 제품/사업 조직의 진척과 가치창출을 전사에 보여줌 ( 지원 조직이 더욱 적극적으로 지원, 제품개발 액션 실행속도가 빨라짐 )
  • 제품/서비스 조직이 결과에 책임을 지도록 함 ( 비즈니스 임팩트에 따라 평가가 가능)
  •  

 

결론 도출

결과

  • 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
  • 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
  • ex) “고객 설문 조사 데이터를 분석한 결과, 고객 만족도와 구매 빈도 사이에 강한 상관관계가 있음을 보여줄 수 있습니다.”
  • 계산과 분석을 해서 나온 결과물

결론

  • 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
  • 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
  • ex) “고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여주는 결과를 토대로, 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다는 결론을 내릴 수 있습니다.”
  • 목적에 대해 어떤 의미가 있는지 설명하는 것

결론 도출 시 주의사항

  • 결과 - 결론 도출 시에는 스토리텔링이 필요
  • 그러나, 필요 이상으로 자신의 해석을 융합하면 안됨 ( 데이터를 통해 알 수 있는 범위에서만 생각해야 함 )

단순하고 쉽게 전달

  • 핵심 지표 위주로 먼저 공유
  • 지표를 해석하는 방법에 대해서도 설명
  • 해당 지표에 오너십이 있는 조직에서 활용할만한 포인트 제안
  • 액션 아이템을 제안 하는것이 핵심

대상자 관점에서의 접근

  • 공유 받는 사람(=대상자)의 시선에서 이해하기 쉽도록 정리
  • 지식의 저주에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부
  • 대상자의 허들이 낮은 시각화 활용

결론 보고서에 쓰면 좋은 플로우

  • 전체 내용을 한 문장으로 정리하는 요약
  • 해당 보고서의 메인 주제
  • 해당 보고서를 쓴 이유와 원하는 변화
  • 문제 정의 단계
  • 핵심 내용 전개
  • 결론 및 액션 아이템

정리

  • 앞서 문제 정의, 지표 설정을 할 당시의 목적을 떠올리며 정리
  • 결론을 공유할 대상이 누구이며, 어떻게 변화하길 원하는지? 생각

 

 

* 데이터 리터러시란 ??

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • 왜?를 항상 생각하기

 

 

 

3. 학습하며 겪었던 문제점 & 에러 

 

-

 

4. 내일 학습 할 것은 무엇인지 

 

SQL 코드카타 , SQLD강의 듣기

'내일배움캠프' 카테고리의 다른 글

[내일배움캠프] 5일차  (0) 2025.05.16
[내일배움캠프] 4일차  (0) 2025.05.15
[내일배움캠프] 2일차  (0) 2025.05.13
[내일배움캠프] 1일차  (0) 2025.05.12
[내일배움캠프 사전캠프] SQL 2일 (3주차 강의)  (1) 2025.05.09