Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- A/B테스트
- vscode
- Ai
- 데이터
- 가설검정
- 내일배움캠프#til#파이썬#python#통계학
- 내일배움캠프#til#데이터 리터러시
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 카이제곱검정
- 내일배움캠프#til#파이썬#python
- t검정
- 라이브 세션
- 딥러닝
- 머신러닝
- 데이터분석
- 이상탐지
- 통계학
- 내일배움캠프#til#파이썬#python#전처리
- 이상치 제거
- 차원축소
- 통계101x데이터분석
- 내일배움캠프#til#sql
- 내일배움캠프#til#sqld
- #내일배움캠프 #사전캠프 #til #sql
- 다중검정
- 제2종오류
- 책
- 통계
- 통계학공부
- 제1종오류
Archives
- Today
- Total
Ming's Life
[내일배움캠프] 3일차 본문
1. 오늘 학습 키워드
- 데이터 리터러시
2. 오늘 학습 한 내용을 나만의 언어로 정리하기
데이터 리터러시
- 데이터를 읽는 능력
- 데이터를 이해하는 능력
- 데이터를 비판적으로 분석하는 능력
- 결과를 의사소통에 활용할 수 있는 능력
데이터 분석에 대한 착각
- 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각
- 데이터를 잘 가공하면 유용한 정보를 얻을 수 있다고 생각
- 분석에 실패하면 방법론, 스킬이 부족한 것이라고 생각
심슨의 역설 (Simpson’s Paradox)
- 심슨의 패러독스란 '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 말한다.
- 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것은 아님
- 데이터에 기반한 결론이라고 해서 이를 맹목적으로 받아들여서는 안됨
시각화를 활용한 왜곡
- 자료의 표현 방법에 따라서 해석의 오류 여지가 존재
샘플링 편향 (Sampling Bias)
- 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생
- 표본이 편향되면서 실제와는 다르게 해석하게 될 수 있음
상관관계와 인과관계
- 상관관계
- 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미
- 파악 방법은 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름
- 인과관계
- 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미
- 원인과 결과가 명확한 것
데이터 리터러시가 필요한 이유
- 크게 3가지 단계로 구분
- 문제 및 가설정의
- 데이터 분석
- 결과 해석 및 액션 도출
- 위 단계 중 ‘생각’이 주요한 단계에서 데이터 리터러시가 필요
- 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함
문제 정의
문제 정의
- 데이터 분석 프로젝트의 성공을 위한 초석
- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
- 프로젝트의 목표를 설정하고 분석 방향을 설정
문제 정의 방법론
- MECE (Mutually Exclusive, Collectively Exhaustive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
- MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음
- 로직 트리(Logic Tree)
- MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
- 상위 문제로부터 시작하여 하위 문제로 계층적 접근
- 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음
데이터 유형
정성적 데이터 (Qualitative Data)
- 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함
- 대부분 텍스트, 비디오, 오디오 형태로 존재
- 정형되지 않고 구조화 되어있지 않는다.
- 데이터를 구조화하기 어렵다.
- 새로운 현상이나 개념에 대한 이해를 심화하는데 사용
정량적 데이터 (Quantitative Data)
- 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있다.
- 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉽다.
- 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있다.
- 지표로 만들기에 용이
- 설문조사, 실험, 인구 통계, 지표 분석 등에 활용
지표 설정
지표
- 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
- 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
- 정의한 문제에 대해 정확하게 파악하기 위해서 필요
지표정리

Retention Ratio
- N-Day 리텐션
- 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
- 일반적으로 사용하는 리텐션 지표는 N-Day 리텐션
- 게임, 소셜 등 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합
- 유저가 Active User로 집계된 최초 날을 Day 0으로 설정
- Day 0에 액티브 상태가 된 모든 유저들의 N일차 리텐션을 계산
- N-Week, N-Month도 가능
- Unbounded 리텐션
- 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
- 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
- 유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
- 해석: Day5는 5일차 이후에 한 번 더 들어온 유저의 비율
- Unbounded 리텐션은 이탈률의 반대 개념
- Bracket 리텐션
- 설정한 특정 기간을 기반으로 재방문율을 측정
- Bracket 리텐션은 N-Day 리텐션을 확장한 개념 > 일/주/월 단위가 아닌 지정한 구간으로 나눔
- 1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차)
- 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석
Funnel
- 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
- 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
- 모든 서비스와 비즈니스는 각 단계로 갈 수록 이용자 수가 줄어들게 됨
- 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정
AARRR
- 디지털 마케팅시 퍼널을 활용하는 프레임워크
- 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
- Acquisition: 유입
- Activation: 활성화
- Retention: 재방문(재구매)
- Revenue: 수익
- Referral: 추천
LTV (Life Time Value, 고객 평생 가치)
- 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
- 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
- LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
- LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
- LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것
북극성 지표
- 제품/서비스의 ‘성공’을 정의
- 제품/서비스가 유저에게 주는 core value를 가장 잘 나타낸 것
- 장기 성장을 위해 필수적으로 모니터링 해야 함
- 제품/서비스 전략의 핵심
- 유저/고객이 제품/서비스에서 느끼는 가치
- 회사의 사업 목표를 나타내는 지표 중 선행지표 (후행X)
* 북극성 지표가 중요한 이유
- 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시
- 제품/사업 조직의 진척과 가치창출을 전사에 보여줌 ( 지원 조직이 더욱 적극적으로 지원, 제품개발 액션 실행속도가 빨라짐 )
- 제품/서비스 조직이 결과에 책임을 지도록 함 ( 비즈니스 임팩트에 따라 평가가 가능)
결론 도출
결과
- 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
- 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
- ex) “고객 설문 조사 데이터를 분석한 결과, 고객 만족도와 구매 빈도 사이에 강한 상관관계가 있음을 보여줄 수 있습니다.”
- 계산과 분석을 해서 나온 결과물
결론
- 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
- 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
- ex) “고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여주는 결과를 토대로, 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다는 결론을 내릴 수 있습니다.”
- 목적에 대해 어떤 의미가 있는지 설명하는 것
결론 도출 시 주의사항
- 결과 - 결론 도출 시에는 스토리텔링이 필요
- 그러나, 필요 이상으로 자신의 해석을 융합하면 안됨 ( 데이터를 통해 알 수 있는 범위에서만 생각해야 함 )
단순하고 쉽게 전달
- 핵심 지표 위주로 먼저 공유
- 지표를 해석하는 방법에 대해서도 설명
- 해당 지표에 오너십이 있는 조직에서 활용할만한 포인트 제안
- 액션 아이템을 제안 하는것이 핵심
대상자 관점에서의 접근
- 공유 받는 사람(=대상자)의 시선에서 이해하기 쉽도록 정리
- 지식의 저주에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부
- 대상자의 허들이 낮은 시각화 활용
결론 보고서에 쓰면 좋은 플로우
- 전체 내용을 한 문장으로 정리하는 요약
- 해당 보고서의 메인 주제
- 해당 보고서를 쓴 이유와 원하는 변화
- 문제 정의 단계
- 핵심 내용 전개
- 결론 및 액션 아이템
정리
- 앞서 문제 정의, 지표 설정을 할 당시의 목적을 떠올리며 정리
- 결론을 공유할 대상이 누구이며, 어떻게 변화하길 원하는지? 생각
* 데이터 리터러시란 ??
- 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
- 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
- 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
- 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
- 왜?를 항상 생각하기
3. 학습하며 겪었던 문제점 & 에러
-
4. 내일 학습 할 것은 무엇인지
SQL 코드카타 , SQLD강의 듣기
'내일배움캠프' 카테고리의 다른 글
| [내일배움캠프] 5일차 (0) | 2025.05.16 |
|---|---|
| [내일배움캠프] 4일차 (0) | 2025.05.15 |
| [내일배움캠프] 2일차 (0) | 2025.05.13 |
| [내일배움캠프] 1일차 (0) | 2025.05.12 |
| [내일배움캠프 사전캠프] SQL 2일 (3주차 강의) (1) | 2025.05.09 |