| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 책
- 데이터
- 카이제곱검정
- 머신러닝
- 데이터분석
- 이상탐지
- A/B테스트
- 내일배움캠프#til#sql
- Ai
- 라이브 세션
- 내일배움캠프#til#데이터 리터러시
- 내일배움캠프#til#파이썬#python#통계학
- 이상치 제거
- t검정
- 가설검정
- 내일배움캠프#til#파이썬#python
- 차원축소
- 내일배움캠프#til#파이썬#python#전처리
- 제2종오류
- 제1종오류
- 통계학
- 딥러닝
- 통계101x데이터분석
- #내일배움캠프 #사전캠프 #til #sql
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 다중검정
- 내일배움캠프#til#sqld
- vscode
- 통계
- 통계학공부
- Today
- Total
목록전체 글 (79)
Ming's Life
문제 설명- 문자열 s를 숫자로 변환한 결과를 반환하는 함수, solution을 완성하세요. 제한 조건s의 길이는 1 이상 5이하입니다.s의 맨앞에는 부호(+, -)가 올 수 있습니다.s는 부호와 숫자로만 이루어져있습니다.s는 "0"으로 시작하지 않습니다. def solution(s): a = int(s) return(a)
문제 설명- 자연수 n을 뒤집어 각 자리 숫자를 원소로 가지는 배열 형태로 리턴해주세요. 예를들어 n이 12345이면 [5,4,3,2,1]을 리턴합니다. 제한 조건n은 10,000,000,000이하인 자연수입니다. def solution(n): a = [int(i) for i in str(n)] a.reverse() return a
문제 설명- 함수 solution은 정수 x와 자연수 n을 입력 받아, x부터 시작해 x씩 증가하는 숫자를 n개 지니는 리스트를 리턴해야 합니다. 다음 제한 조건을 보고, 조건을 만족하는 함수, solution을 완성해주세요. 제한 조건x는 -10000000 이상, 10000000 이하인 정수입니다.n은 1000 이하인 자연수입니다. def solution(x, n): result = [] for i in range(1, n + 1): result.append(x * i) return resultdef solution(x, n): return [x * i for i in range (1, n+1)]
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 앙상블 기법☑️ 앙상블(Ensemble)의 기본 아이디어여러 개의 모델을 조합하여, 하나의 모델보다 더 좋은 예측 성능을 내는 방법왜 사용하는가?서로 다른 관점(모델)을 결합함으로써 오류를 줄일 수 있음개별 모델의 편향(Bias)과 분산(Variance)을 상호 보완 ☑️ 배깅(Bagging, Bootstrap Aggregating)원리학습 데이터를 무작위로 여러 부분 샘플(부트스트랩)로 나누어 각각 독립적으로 모델을 학습예측 시에는 여러 모델의 결과를 평균(회귀) 혹은 다수결(분류)로 결정예시랜덤 포레스트(Random Forest) - 분류, 회귀 모두 가능결정 트리 여러 개를 만들 때, 각 트리에 사용하는 ..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 분류 모델 개요☑️ 지도학습이란 ?입력 데이터(특징, Feature)와 정답(Label)이 주어졌을 때, 모델이 정답을 예측하도록 학습하는 방식.회귀(연속값 예측)와 분류(범주 예측)의 차이점? ☑️ 분류(Classification)의 정의분류의 목적데이터가 어느 범주(클래스)에 속하는지 예측.ex) 스팸 메일 분류(스팸/정상), 질병 여부(양성/음성), 제조 공정 품질(불량/정상) 등.분류 문제를 해결하기 위해 자주 활용되는 알고리즘 : Logistic Regression, SVM ☑️ 분류 모델이 많이 쓰이는 이유이진 분류(양성/음성, 합격/불합격, 정상/불량 등)는 직관적이고 다양한 산업에서 필요함.데이터..
1. 오늘 학습 키워드가상환경 설정하는 법 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 가상환경의 필요성종종 파이썬 라이브러리를 설치하다 보면 모듈끼리 버전이 맞지 않아 에러가 나는 상황이 발생한다. 이럴때 버전을 맞춰줌으로서 해결할 수 도 있지만, 컴퓨터에 새로운 파이썬 환경을 처음부터 세팅하여 해결하는 편이 나을 때가 많다. 가상환경 설정1. 가상환경 생성 in 터미널python -m venv {가상환경명} # 가상환경 만들기해당 디렉토리에서 {가상환경명} 에 해당하는 디렉토리가 생성됨 2. 가상환경 실행# 윈도우.\\venv\\Scripts\\activate# 맥북source venv/bin/activate 3. 가상환경 설정 완료 확인# 설치된 파이썬 모듈을 조회하면 깨끗하게 없음(pi..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 회귀 분석 개요☑️ 회귀 분석이란?종속변수(Y)와 하나 이상의 독립변수(X) 간의 관계를 추정하여, 연속형 종속변수를 예측하는 통계/머신러닝 기법ex) “공부한 시간(X)에 따라 시험 점수(Y)가 어떻게 변하는가?” 를 예측지도학습에서의 분류(Classification)와 회귀(Regression)의 차이분류: 결과값이 이산형(클래스 라벨)회귀: 결과값이 연속형(숫자 값)사람의 지능적인 작업을 기계가 수행하도록 만드는 광범위한 개념 ☑️ 회귀 모델을 사용하는 이유1. 미래 값 예측: 판매량, 주가, 온도 등 실수값 예측에 사용 2. 인과 관계 해석(통계 관점): 특정 독립변수가 종속변수에 미치는 영향력을 해석하..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 데이터 전처리 개요원시(raw) 데이터에서 불필요하거나 손실(노이즈)이 있는 부분을 처리하고, 분석 목적에 맞는 형태로 만드는 과정☑️ 필요성1. 모델 정확도 및 신뢰도 향상2. 이상치나 결측치가 많은 상태로 학습하면 예측 성능이 크게 떨어짐3. 효율적인 데이터 분석과 모델 훈련을 위해 필수적인 단계 ☑️ 마케팅 사례온라인 설문이나 쿠폰 사용 정보가 중간에 누락되거나, 특정 채널(이메일·SNS·오프라인)에서 전송된 쿠폰 수 확인 불가한 경우 결측값 발생광고 클릭률 중 특정 상품의 노출수/클릭수가 월등히 높아 평균을 왜곡, 혹은 이벤트가 끝나자마자 조회수가 급감하는 경우 이상치 기록고객 이탈 예측 시 ‘이탈 고객..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 머신러닝이란 ?컴퓨터가 인간의 개입 없이 데이터를 학습하여 패턴을 찾아내고, 새로운 데이터에 대해 예측이나 분류를 수행하는 기술☑️ 머신러닝의 3대 요소1. 데이터 : 데이터가 참고하는 정보의 모음2. 알고리즘(Algorithm) : 문제를 해결하기 위해 순서대로 처리하는 방법이나 규칙3. 컴퓨팅 파워(Computing Power) : 컴퓨터가 얼마나 빠르고 많이 일(연산)을 할 수 있는지 나타내는 능력치 ☑️ 머신러닝, AI, 딥러닝의 관계인공지능(AI)사람의 지능적인 작업을 기계가 수행하도록 만드는 광범위한 개념머신러닝AI를 실현하기 위한 방법 중 하나로, 데이터로부터 특징이나 규칙을 찾아내서 학습 하는 것..
1. 오늘 학습 키워드통계101x데이터분석 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 통계101x데이터분석 6장 6장 다양한 가설검정6-1 다양한 가설검정🔍 가설검정 방법 구분해 사용하기어떤 가설검정 방법이든 간에 해석의 기본흐름은 공통이다.가설검정 방법을 선택할 때는 데이터 유형, 표본의 수, 양적 변수 분포의 성질을 먼저 확인한다.📌 1. 확인하고 싶은 대상에 따라 귀무가설과 대립가설을 설정한다. 2. 데이터로 가설검정에 필요한 검정통계량을 계산한다. 3. 귀무가설이 옳다는 가정하에 통계량의 분포를 생각하고, 데이터로 계산한 통계량이 분포의 어느 위치에 있는지를 구하여 p값을 계산한다. ✅ 데이터 유형데이터 유형이 양적 변수인지 질적 변수인지에 따라 해..