| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 딥러닝
- 책
- 데이터분석
- 내일배움캠프#til#파이썬#python
- 라이브 세션
- 차원축소
- 통계
- 이상치 제거
- A/B테스트
- 제1종오류
- 데이터
- 이상탐지
- vscode
- 내일배움캠프#til#파이썬#python#통계학
- 내일배움캠프#til#sqld
- 내일배움캠프#til#데이터 리터러시
- 제2종오류
- #내일배움캠프 #사전캠프 #til #sql
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 다중검정
- 통계101x데이터분석
- 통계학공부
- 머신러닝
- t검정
- 가설검정
- Ai
- 내일배움캠프#til#sql
- 통계학
- 내일배움캠프#til#파이썬#python#전처리
- 카이제곱검정
- Today
- Total
Ming's Life
[내일배움캠프] 4일차 본문
1. 오늘 학습 키워드
- SQLD 자격증 공부
2. 오늘 학습 한 내용을 나만의 언어로 정리하기
모델링의 이해
모델링
데이터베이스 관리 시스템(RDBMS)이 지원하는 데이터베이스의 구조나 형식을 의미
데이터 베이스 모델링
정보 시스템 구축을 위해 데이터 관점의 업무를 분석하는 과정
현실 세계의 데이터를 약속된 표기법에 의해 표현하는 과정
데이터베이스를 구축하기 위한 분석 및 설계의 과정
데이터 모델이 제공하는 기능
시각화 : 시스템을 원하는 모습으로 시각화해서 보여줄 수 있도록 한다
문서화 : 시스템의 구조와 행동을 문서화한다
구체화 : 특정한 목표에 따라 구체화된 상세 수준의 표현 방법을 제공한다
구조화된 툴 제공 : 시스템을 구축하는 구조화된 틀을 제공한다
다양한 관점 제공 : 다양한 영역에 집중하기 위해 다른 영역의 세부 사항은 숨기는 다양한 관점을 제공한다
모델링 특징
추상화 (Abstraction) : 일정한 형식에 맞추어 표현하는 것을 의미
단순화 (Simplification) : 복잡한 현실 세계를 약속된 규칙에 기반한 제한된 표기법이나 언어로 표현
명확화 (Clarity) : 대상에 대한 애매모호함을 제거하고 현상을 정확하게 기술하는 것
데이터 모델링 단계
개념적 데이터 모델링 (Conceptual Data Modeling)
- 조직이나 사용자가 필요로 하는 데이터의 요구사항을 찾고 분석하는 과정
- 복잡하지 않고 중요한 부분을 위주로 모델링하는 단계
- 추상화 수준이 가장 높고 업무 중심적인 모델링
- 전사적 관점에서 기업의 데이터 모델링
논리적 데이터 모델링 (Logical Data Modeling)
- 비즈니스 과정에서 나타나는 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법/과정
- 누가(Who), 어떻게(How: Process) 그리고 전산화와는 별개로 비즈니스 데이터에 존재하는 사실을 인식하여 기록하는 것
- 정규화*를 수행하여 데이터 모델의 독립성 확보
*정규화 : 논리 데이터 모델의 일관성을 확보하고 중복을 제거하여 보다 신뢰성 있는 데이터 구조를 얻는 방법
물리적 데이터 모델링 (Physical Data Modeling)
- 논리적 데이터 모델이 데이터 저장소로서 어떻게 컴퓨터 하드웨어에 표현될 것인지를 다루는 과정
- 구축할 데이터베이스 관리 시스템에 테이블, 인덱스 등을 생성하는 단계
- 성능, 보안, 가용성을 고려하여 구축

데이터모델링의 관점
데이터 관점 (What)
- 업무가 어떤 데이터와 관련 있는지 모델링하는 방법에 대해 고민하는 관점
- 비즈니스 프로세스에서 사용되는 데이터
프로세스 관점 (How)
- 업무가 실제 하는 일이 무엇인지 그리고 무엇을 해야 하는지에 대해 모델링하는 방법을 고민하는 관점
- 도메인 분석, 시나리오 분석
데이터와 프로세스의 상관 관점 (Intersection)
- 업무가 처리하는 일의 방법에 따라 데이터는 어떤 영향을 받고 있는지를 중심으로 모델링을 하는 방법
- 일에 의해 데이터가 어떤 변화가 일어나지는지에 대해 초점을 맞추는 관점
- CRUD(Create, Read, Update, Delete) 분석

데이터 모델링의 중요성
파급효과 (Leverage)
- 구체적인 내용은 변해도 큰 구조는 변하지 않도록 만드는 것
간결한 표현 (Conciseness)
- 데이터 모델은 구축할 시스템의 정보에 대한 요구 사항과 한계점을 가장 명확하고 간결하게 표현할 수 있는 도구
- 정보 요구 사항이 정확하고 간결하게 표현되어야 한다는 것
데이터 품질 (Data Quality)
- 좋은 데이터를 모을 수 있도록 데이터 구조를 잘 설계해야 하는 것
1. 중복 (Duplication)
◦ 데이터베이스 여러 곳에 같은 정보를 중복해서 저장하는 행위입니다.
2. 비유연성 (Inflexibility)
◦ 환경이 바뀌었을 때 데이터가 사용 가능 여부입니다.
◦ 데이터 모델을 어떻게 설계했느냐에 따라 사소한 업무의 변화에도 데이터 모델의 유지 보수가 쉬울 수도 있고 어려울 수도 있습니다.
3. 비일관성 (Inconsistency)
◦ 데이터의 중복이 없다고 해도 일관적이지 않은 데이터가 나타날 수 있습니다.
◦ 데이터 모델링을 할 때는 데이터와 데이터 간의 상호 연관 관계에 대한 명확한 정의를 해야 할 필요가 있습니다.
프로젝트 라이프 사이클이란
- 프로젝트의 시작부터 완료에 이르기까지 거치는 일련의 단계를 의미
- 폭포수 모델(Waterfall)과 애자일 모델(Agile)
- 로젝트의 범위가 명확할 때 폭포수 방법론(Waterfall)을 적용
| 프로젝트 라이프 사이클 (Waterfall 기반) |
정보공학, 구조적 방법론 | 개발 |
| 분석 | 논리 및 개념 데이터 모델링 | 프로세스 모델링 |
| 설계 | 물리 데이터 모델링 | AP 설계 |
| 개발 | DB 구축, 변경, 관리 | AP 개발 |
| 테스트 | DB 튜닝 | AP 테스트 |
| 전환 / 이행 | DB 전환 | AP 설치 |
데이터 모델링의 이해관계자
- 정보시스템을 구축하는 모든 사람

3층 스키마 (3-Level Schema)
데이터 독립성의 필요성
- 데이터 모델링의 과정에서 신경 써야 하는 것 중 하나는 데이터의 일체적 구성
* 일관된 형태로 데이터를 수집하는 것 = 데이터의 독립적 구성

데이터베이스 3단계 구조
- 3층 스키마란, 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들간의 관계를 정의한 ANSI 표준
- 단계 계층으로 분리하여 독립성을 확보해 각 계층을 뷰(View)
* 사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 표준

| 항목 | 내용 | 비고 |
| 외부 스키마 (External Schema) |
- View 단계 여러 개의 사용자 관점으로 구성합니다. - 개별 사용자가 보는 DB 스키마입니다. - 실제로 관심 있는 데이터베이스 부분을 설명하고 나머지는 감춥니다. |
- 사용자 관점 - 접근하는 특성에 따른 스키마를 구성 |
| 개념 스키마 (Conceptual Schema) |
- 데이터 베이스의 물리적인 저장 구조에 대한 부분은 숨기고, 데이터의 전체적인 구조와 관계에 대해 집중합니다. - 모든 사용자 관점을 통합한 조직 전체의 DB를 기술합니다. - 모든 응용 시스템들이나 사용자들이 필요로 하는 데이터를 통합한 조직 전체의 DB를 기술한 것입니다. - DB에 저장되는 데이터와 그들간의 관계를 표현하는 스키마입니다. |
- 설계자 관점, 통합 관점 - 통합 데이터베이스 구조 |
| 내부 스키마 (Internal Schema) |
- 내부 단계, 내부 스키마로 구성합니다. - DB가 물리적으로 저장된 형식입니다. - 물리적 장치에서 데이터가 실제적으로 저장되는 완전히 구체적인 방법을 표현하는 스키마입니다. | - 개발자 관점 - 물리적 저장 구조 |
요약
- 데이터베이스를 3가지의 큰 범주로 분리해보자라는 컨셉
- 사상(mapping)은 각 각의 범주간의 요청/응답을 전송하는 것
- 외부 스키마에서 요청이 들어오면 DBMS에 의해 개념 스키마
- 내부 스키마로 전달됨 여기에서 요청과 응답을 변환하는 프로세스를 사상(mapping) 이라고 함
- 내부 스키마 : 물리적 저장 구조를 갖춘 모델
- 개념 스키마
: 전체 데이터베이스의 설계를 설명할 수 있는 모델 (구조, 관계등)
: 데이터 구조의 구현 정보와 같은 내부 상세 정보는 보지 못함
- 외부 스키마 : 유저 어플리케이션(프로그램)은 데이터베이스 시스템의 최상위 단계
3층 스키마의 독립성
| 독립성 | 설명 | 특징 |
| 논리적 독립성 | - 개념 스키마가 변경되어도 외부 스키마에는 영향을 미치지 않도록 지원합니다. - 논리적 구조가 변경되어도 응용 프로그램에 영향이 없습니다. |
- 사용자 특성에 맞게 변경이 가능합니다. - 통합 구조로 변경 가능합니다. |
| 물리적 독립성 | - 내부 스키마가 변경되어도 개념 스키마는 영향을 받지 않도록 지원합니다. - 저장 장치의 구조 변경은 응용프로그램과 개념 스키마에 영향을 주지 않습니다. |
- 물리적 구조의 영향 없이 개념 구조로 변경 가능합니다. - 개념 구조의 영향 없이 물리적인 구조로 변경 가능합니다. |
논리적 독립성
- 우리가 데이터 저장이 필요한 속성을 추가/변경이 필요할 때 외부 응용 프로그램을 변경하지 않아도됨
물리적 독립성
- 실제로 데이터를 저장하는 위치나 파일 이름을 변경하더라도 데이터베이스 전체 관점 즉,
개념 스키마 관점에서는 아무런 영향이 없음
* 검색 속도를 높이기 위해 데이터가 저장되는 파일의 구조를 바꿨다고 해서 (내부 스키마),
전체적인 데이터 베이스 구조/설계가 달라지거나 (개념 스키마) 응용 프로그램단 (외부 스키마)이 변경되면 안된다는 것
데이터 모델링의 요소와 ERD
데이터 모델링의 중요한 3가지 개념
1. 엔터티(Entity) - 업무가 관여하는 어떤 것(thing)
- 사물이나 사건 등을 바라볼 때 전체를 지칭하는 용어입니다.
이 용어를 통해서 업무가 어떤 부분을 중심으로 벌어지고 초점이 맞춰져있는지를 확인할 수 있습니다.
- 예를 들어, 우리 모두는 개개인이 하나의 Entity라고 볼 수 있습니다.
사물, 사건이 어떤지에 따라 작은 차이는 있을 수 있습니다.
* 눈에 보이는 개념이든 아니든 데이터 모델링에서 사용되는 하나의 대상, 객체
2. 속성(Attribute) - 어떤 것이 갖는 성격
- 어떤 것이 갖는 세부적인 성격을 의미합니다. Entity가 지닐 수 있는 여러 특징으로 볼 수 있습니다.
- 예를 들어, 여러분 각자가 같은 어떤 특징입니다. 키, 몸무게, 성격, 취미 등 다양한 것이 속성에 해당합니다.
3. 관계(Relationship) - 업무가 갖는 어떤 것 간의 관계
- Entity와 Entity가 서로 간의 관계를 가질 수 있는데, 둘 사이에는 어떠한 연결 고리(연관성)가 존재합니다.
- 헬스장이라면 트레이너 엔티티, 고객 엔티티는 어떠한 관계를 맺고 있을까?
한 명의 트레이너가 여러명의 고객을 응대하는 관계, 즉 1:N 관계를 맺고 있습니다.
데이터 모델링을 위한 ERD
RED란 ?
Entity Relationship Diagram의 약자로 데이터들의 관계를 나타낸 도표
ERD 작성법
1. 엔터티를 정의하고 그린다.
2. 엔터티를 적절하게 배치한다.
- 가장 중요한 엔터티를 좌측 상단에 배치하고 이것을 중심으로 다른 엔터티들을 나열한다.
(왼쪽에서 오른쪽, 위쪽에서 아래쪽으로)
3. 엔터티간의 관계를 설정한다.
4. 관계명을 서술한다.
5. 관계의 참여도를 기술한다.
- 특정 엔터티와 다른 엔터티 간의 관계수를 의미해요.
6. 관계의 필수 여부를 기술한다.
데이터 모델 표기법
대표적인 데이터 모델 표기법은 IE/Crow’s Foot 표기법과 Barker/Case*Method 표기법이 있다.

Barker 표기법 참고사항
# : 식별자 속성 앞에 표기
* : 필수 속성 앞에 표기
o : 선택 속성 앞에 표기
좋은 데이터 모델의 요소
완전성(Completeness)
- 업무에서 필요로 하는 모든 데이터가 모델에 정의되어 있어야 한다.
중복 제재(Non-Redundancy)
- 하나의 데이터베이스 내에 동일한 사실은 한 번만 기록해야 합니다.
업무 규칙(Business Rules)
- 데이터 모델에서 매우 중요한 요소 중 하나는 데이터 모델링 과정에서 도출되고
규명되는 수많은 업무규칙(Business Rules)을 데이터 모델에 표현
데이터 재사용(Data Reusability)
- 데이터는 언제든 다시 사용할 수 있는 형태로 가공되고 보관되어야 합니다.
의사소통(Communication)
- 데이터 모델은 의사소통 도구로서의 역할을 해야 합니다.
통합성(Integration)
- 동일한 데이터 구조는 데이터를 구성하는 조직 전체에서 한 번만 정의되어야 합니다.
- 바람직한 데이터 구조의 형태는 동일한 데이터일 경우 조직의 전체에서 한 번만 정의되고
이를 여러 다른 영역에서 참조, 활용하는 것입니다.
3. 학습하며 겪었던 문제점 & 에러
-
4. 내일 학습 할 것은 무엇인지
SQL 코드카타 , SQLD강의 듣기
'내일배움캠프' 카테고리의 다른 글
| [내일배움캠프] 6일차 (0) | 2025.05.19 |
|---|---|
| [내일배움캠프] 5일차 (0) | 2025.05.16 |
| [내일배움캠프] 3일차 (0) | 2025.05.14 |
| [내일배움캠프] 2일차 (0) | 2025.05.13 |
| [내일배움캠프] 1일차 (0) | 2025.05.12 |