Ming's Life

[내일배움캠프] 11일차 -1 본문

내일배움캠프

[내일배움캠프] 11일차 -1

chamiii 2025. 5. 26. 21:13

1. 오늘 학습 키워드

  • 데이터 분석 파이썬

 


 

2. 오늘 학습 한 내용을 나만의 언어로 정리하기

 

 

함수 기본 배우기

함수의 개념

- 함수는 입력을 받아 원하는 처리를 한 후 출력을 내보내는 일련의 작업을 수행하는 코드 블록입니다.

- 프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의합니다.

 

함수의 필요성

- 코드 재사용: 반복되는 코드를 함수로 정의하여 여러 곳에서 재사용할 수 있습니다.

- 모듈화: 프로그램을 여러 개의 작은 모듈로 나누어 개발 및 관리할 수 있습니다.

- 유지 보수 용이성: 함수는 각각의 기능을 독립적으로 정의하므로, 수정이나 확장이 필요할 때 해당 함수만 수정하면 됩니다.

- 가독성 향상: 함수는 코드의 의도를 명확하게 표현할 수 있으며, 복잡한 작업을 함수로 분해하여 이해하기 쉽게 만듭니다.

 

 

함수의 정의와 호출 방법

함수정의

def 함수이름(매개변수1, 매개변수2, ...):
    # 함수 내부에서 수행할 작업
    return 결과값  # (선택적) 함수의 결과를 반환

- def 키워드를 사용하여 함수를 정의합니다.

- 함수 이름 뒤에 소괄호 안에 매개변수(입력 값)를 정의합니다.

- 함수 내부에서 필요한 작업을 수행한 후, **return**을 사용하여 결과값을 반환할 수 있습니다.

 

함수 호출

결과 = 함수이름(인수1, 인수2, ...)

- 함수를 호출할 때는 함수 이름을 적고, 소괄호 안에 인수(함수에 전달할 값)를 넣어 호출합니다.

- 필요에 따라 결과를 변수에 저장할 수 있습니다.

 

간단한 예시 코드

# 함수 정의
def greet(name):
    message = "Hello, " + name + "!"
    return message

# 함수 호출
greeting = greet("Alice")
print(greeting)  # 출력: Hello, Alice!

- 위의 예시에서는 greet라는 함수를 정의하여 이름을 전달하면 해당 이름과 함께 인사말을 반환하는 간단한 함수를 만들었습니다.

- 함수를 호출하면 반환된 인사말을 출력합니다.

- 이와 같이 함수를 사용하면 코드를 구조화하고 재사용 가능한 모듈로 만들 수 있습니다.

 

 

간단한 계산의 함수 만들기

평균 계산 함수

이 함수는 주어진 숫자 리스트의 평균을 계산하는 간단한 데이터 분석 계산을 수행합니다.

def calculate_mean(numbers):
    """
    주어진 숫자 리스트의 평균을 계산하는 함수

    Parameters:
    numbers (list of int or float): 평균을 계산할 숫자들의 리스트

    Returns:
    float: 주어진 숫자 리스트의 평균값
    """
    total = sum(numbers)
    mean = total / len(numbers)
    return mean

# 함수 호출 및 예시
data = [10, 20, 30, 40, 50]
average = calculate_mean(data)
print("평균:", average)

- 위의 예시에서는 calculate_mean이라는 함수를 정의하여 주어진 숫자 리스트의 평균을 계산합니다.

- 이 함수는 숫자 리스트를 받아서 sum() 함수를 이용해 총합을 구하고, 리스트의 길이로 나누어 평균을 계산합니다. 그리고 그 값을 반환합니다.

- 이 함수를 호출할 때는 숫자 리스트를 인수로 전달하면 됩니다.

- 위의 코드에서는 [10, 20, 30, 40, 50]라는 리스트를 전달하여 평균을 계산하고 출력합니다.

- 이러한 함수는 데이터 분석에서 계산을 수행할 때 유용하게 사용될 수 있습니다.

 

 

다양한 함수 예시

- 아래에는 조건문, 반복문, 리스트, 튜플, 딕셔너리 등을 활용한 다양한 함수 예시

 

숫자 리스트에서 최대값을 찾는 함수

def find_max(numbers):
    max_num = numbers[0]
    for num in numbers:
        if num > max_num:
            max_num = num
    return max_num

# 함수 호출
print(find_max([3, 7, 2, 9, 5]))  # 출력: 9

 

튜플의 모든 요소를 곱하는 함수

def multiply_tuple(tup):
    result = 1
    for num in tup:
        result *= num
    return result

# 함수 호출
print(multiply_tuple((2, 3, 4)))  # 출력: 24

 

주어진 문자열에서 각 문자의 출현 빈도를 딕셔너리로 반환하는 함수

def char_frequency(string):
    freq_dict = {}
    for char in string:
        if char in freq_dict:
            freq_dict[char] += 1
        else:
            freq_dict[char] = 1
    return freq_dict

# 함수 호출
print(char_frequency("hello"))  # 출력: {'h': 1, 'e': 1, 'l': 2, 'o': 1}

 

 


함수 심화 배우기

 

전역변수 (Global Variables)

- 전역변수는 프로그램 전체에서 접근 가능한 변수로, 어디서든지 사용할 수 있습니다.

- 전역변수는 프로그램이 시작될 때 생성되고, 프로그램이 종료될 때까지 메모리에 유지됩니다.

- 전역변수는 프로그램의 어디서든지 접근할 수 있으므로, 여러 함수에서 공통적으로 사용되는 값을 저장할 때 유용합니다.

- 하지만 너무 많은 전역변수를 사용하면 코드의 가독성이 떨어지고 디버깅이 어려워질 수 있습니다.

 

지역변수 (Local Variables)

- 지역변수는 특정한 범위(예: 함수 내부)에서만 접근 가능한 변수로, 해당 범위를 벗어나면 사용할 수 없습니다.

- 지역변수는 해당 범위에서 생성되고, 범위를 벗어나면 메모리에서 사라집니다.

- 함수 내에서 정의된 변수는 해당 함수 내에서만 사용 가능한 지역변수입니다.

- 지역변수는 함수 내에서만 사용되므로, 해당 함수에서만 유효하고 다른 함수나 코드 블록에서는 사용할 수 없습니다.

- 지역변수는 함수가 실행될 때 생성되고, 함수가 종료되면 메모리에서 제거되므로 메모리 관리에 효율적입니다.

 

# 전역변수 예시
global_var = 10

def global_example():
    print("전역변수 접근:", global_var)

global_example()  # 출력: 전역변수 접근: 10

# 지역변수 예시
def local_example():
    local_var = 20
    print("지역변수 접근:", local_var)

local_example()  # 출력: 지역변수 접근: 20

# 함수 내에서 전역변수를 수정하는 예시
def modify_global():
    global global_var
    global_var = 30
    print("함수 내에서 수정된 전역변수:", global_var)

modify_global()  # 출력: 함수 내에서 수정된 전역변수: 30
print("수정된 전역변수 확인:", global_var)  # 출력: 수정된 전역변수 확인: 30

 

- 위의 코드에서 global_var는 전역변수로, 프로그램 어디서든지 접근 가능합니다.

- 반면에 local_var는 함수 local_example() 내에서만 접근 가능한 지역변수입니다.

- 함수 내에서는 global 키워드를 사용하여 전역변수를 수정할 수 있습니다.

- 함수 내에서 전역변수를 수정하더라도, 해당 변수는 전역적으로 수정됩니다.

 

 

인수(argument)와 매개변수(parameter)의 차이

- 함수를 정의할 때 매개변수(parameter)와 함수를 호출할 때 전달되는 값(argument)은 혼동하기 쉬운 개념입니다.

- 이 둘의 차이에 대해 설명하고, 예시를 통해 구체적으로 이해해 보겠습니다.

- 매개변수(Parameter)와 인수(Argument)의 개념  / (인수 혹은 전달인자하고 하고 표현한다.) 

 

매개변수(Parameter)

- 함수를 정의할 때 함수가 받아들이는 값을 지정하는 변수입니다.

- 함수의 헤더 부분에서 매개변수가 정의되며, 함수 내부에서 사용됩니다.

- 함수를 정의할 때 매개변수를 정의하고, 함수가 호출될 때 매개변수에 해당하는 값을 전달받습니다.

 

인수(Argument)

- 함수를 호출할 때 함수에 전달되는 값입니다.

- 함수를 호출할 때 전달되는 실제 값이며, 함수를 호출할 때마다 다를 수 있습니다.

- 함수 호출 시 매개변수에 전달되는 값으로, 해당 값은 함수 내부에서 매개변수로 사용됩니다.

- 전달인자라는 표현으로 사용되기도 해요!

# 매개변수(parameter) 예시
def greet(name):  # 여기서 'name'은 매개변수입니다.
    print("Hello, " + name + "!")
    
# 함수 호출할 때 전달되는 값이 인수(argument)입니다.
greet("Alice")  # 함수 호출 시 "Alice"는 greet 함수의 매개변수 'name'에 전달됩니다.

 

- 위의 코드에서 greet 함수의 매개변수는 name입니다.

- 이 함수를 호출할 때 "Alice"라는 값이 name 매개변수로 전달됩니다.

- 여기서 "Alice"가 인수입니다.

 

더 복잡한 예시

def add_numbers(x, y):  # 'x'와 'y'는 매개변수입니다.
    result = x + y
    return result

# 함수 호출 시 10과 20이 각각 'x'와 'y' 매개변수에 전달됩니다.
sum_result = add_numbers(10, 20)  # 10과 20이 전달인자(Argument)입니다.
print("Sum:", sum_result)  # 출력: Sum: 30

 

 

- 코드에서 add_numbers 함수의 매개변수는 x와 y입니다.

- 이 함수를 호출할 때 10과 20이 각각 x와 y 매개변수로 전달됩니다.

- 여기서 10과 20이 인수입니다. 함수 내부에서는 이 인수들을 이용하여 연산을 수행합니다.

 

 

위치 인수 (Positional Arguments)란?

- 함수 호출 시 전달되는 인자(argument)는 두 가지 유형이 있습니다.

- 위치 인수(positional argument)와 키워드 인수(keyword argument)입니다.

- 위치 전달인수는 함수 정의에서 매개변수(parameter)의 위치에 따라 전달되는 인수입니다.

- 위치 전달인수는 인자의 값이 함수의 매개변수에 순서대로 매핑됩니다.

- 함수 호출 시 위치 전달인수는 매개변수의 위치에 따라 전달됩니다.

def greet(name, age):
    print("안녕하세요", name, "님! 나이는 ", age, "세입니다.")

# 위치 전달인자 사용
greet("철수", 30)  # 출력: 안녕하세요, 철수님! 나이는 30세입니다.

 

- 위 예시에서는 "철수"가 name 매개변수에, 30이 age 매개변수에 순서대로 전달됩니다.

 

 

키워드 인수 (Keyword Arguments) 설정하기

- 함수를 호출할 때, 인수를 순서대로 전달하는 대신에 특정 매개변수에 값을 할당하여 전달할 수 있습니다. 

def greet(name, age):
    print("이름:", name)
    print("나이:", age)

# 키워드 인수를 사용하여 함수 호출
greet(name="Alice", age=30)

 

- 위의 코드에서 greet 함수는 name과 age 두 개의 매개변수를 가집니다.

   함수를 호출할 때, 각 매개변수에 직접 값을 할당하여 전달하고 있습니다.

 

기본값 (Default Values) 설정하기

- 함수의 매개변수에 기본값을 설정할 수 있습니다.

   이는 해당 매개변수에 인수가 전달되지 않았을 때 기본값으로 사용됩니다.

def greet(name="Guest", age=25):
    print("이름:", name)
    print("나이:", age)

# 기본값이 설정된 함수 호출
greet()

 

- 위의 코드에서 greet 함수의 매개변수인 **name**과 **age**는 각각 **"Guest"**와 **25**의 기본값을 가집니다.

- 함수를 호출할 때 인수를 전달하지 않으면 기본값이 사용됩니다.

 

 

키워드 인수와 기본값을 함께 사용하기

- 키워드 인수와 기본값을 함께 사용하여 함수를 호출할 수 있습니다.

def greet(name="Guest", age=25):
    print("이름:", name)
    print("나이:", age)

# 키워드 인수를 사용하여 함수 호출
greet(name="Alice", age=30)

# 일부 매개변수에만 키워드 인수 사용하여 호출
greet(name="Bob")

 

- 위의 코드에서는 greet 함수를 호출할 때 키워드 인수를 사용하여 name과 age에 값을 전달하고 있습니다.

- 또한 일부 매개변수에만 키워드 인수를 사용하여 값을 전달할 수 있습니다.

- 함수의 매개변수에 기본값이 설정되어 있으면 해당 매개변수에 값을 전달하지 않아도 기본값이 사용됩니다.

 

 

가변 인수 (Variable-length Arguments) 활용하기

- 여러 개의 인수들을 받을 수 있는 함수를 만들기 위해서는 가변인수(variable-length arguments)를 활용할 수 있습니다.

- 이를 위해 파이썬에서는 *args와 **kwargs를 사용합니다.

 

  • **args**는 함수를 호출할 때 임의의 개수의 위치 인수를 전달할 수 있도록 합니다.
  • ***kwargs**는 함수를 호출할 때 임의의 개수의 키워드 인수를 전달할 수 있도록 합니다.
def sum_values(*args):
    total = 0
    for num in args:
        total += num
    return total

result = sum_values(1, 2, 3, 4, 5)
print("합계:", result)  # 출력: 합계: 15

 

- 위의 함수 sum_values는 임의의 개수의 위치 인수를 받아서 그 합계를 계산합니다.

- 함수 내에서는 args라는 튜플로 위치 인수들을 받아 처리합니다.

 

*kwargs를 사용하여 키워드 인수를 받는 경우도 비슷합니다.

def print_info(**kwargs):
    for key, value in kwargs.items():
        print(f"{key}: {value}")

print_info(name="Alice", age=30, country="USA")

 

- 위의 코드에서 print_info 함수는 임의의 개수의 키워드 인수를 받아서 그 정보를 출력합니다.

- 함수 내에서는 **kwargs**라는 딕셔너리로 키워드 인수들을 받아 처리합니다.

 

 

 

 




하기 내용은 알아두면 좋은것 .. ? 우선 .. 나중에 공부할 것 .. 

 

 

함수가 데이터 분석에서 사용되는 예시

 

데이터 전처리 함수

  • 데이터 분석을 진행할 때 데이터 전처리는 매우 중요합니다.
  • 이를 위해 다양한 전처리 함수를 사용할 수 있습니다.
  • 예를 들어 데이터 정규화, 결측치 처리, 특성 스케일링 등의 함수를 사용하여 데이터를 전처리할 수 있습니다.
  • 아래 내용중 아직 배우지 않은 개념들이 있습니다 (mean, std, fillna) 이 부분은 pandas 시간에 자세히 배울 예정이니 지금은 함수의 개념만 이해하시면 됩니다 🙂
def stadardization(data):
    # 데이터 표준화 함수
    scaled_data = (data - data.mean()) / data.std()
    return scaled_data

def impute_missing_values(data):
    # 결측치 처리 함수
    filled_data = data.fillna(data.mean())
    return filled_data

def nomalization(data):
    # 데이터 정규화 함수
    scaled_data = (data - data.min()) / (data.max() - data.min())
    return scaled_data

 

  • 참고!) 정규화(Normalzation), 표준화(Standardization), 결측값(Missing Values)에 대한 부가적인 설명입니다 🙂
    • 정규화(Normalization)
      • 정규화는 데이터를 일정한 범위로 변환하여 비교나 분석을 용이하게 하는 과정입니다. 주로 0과 1 사이의 값으로 변환하거나 -1과 1 사이의 값으로 변환하는 등의 방법이 사용됩니다.
      • 정규화는 다차원 데이터에서 각 차원의 중요성을 동등하게 만들어주는 역할을 합니다.
    • 표준화(Standardization)
      • 표준화(Standardization)는 데이터의 평균을 0으로, 표준편차를 1로 만들어주는 데이터 전처리 과정을 말합니다.
      • 주로 데이터의 분포를 정규분포로 만들거나, 특성 간의 스케일을 일치시키기 위해 사용됩니다.
      • 이는 일부 머신러닝 알고리즘에서 가정하는 가우시안 분포를 만족시키는 데 도움이 됩니다.
    • 결측값(Missing Values)
      • 결측값은 데이터에서 측정되지 않거나 없는 값을 의미합니다. 이는 데이터 수집 과정에서 발생할 수 있거나, 처리 과정에서 발생할 수 있습니다. 결측값은 분석이나 모델링 과정에서 문제를 일으킬 수 있으며, 이를 처리하는 방법이 중요합니다.
      • 데이터 전처리 과정에서 결측값을 채우거나, 해당 행이나 열을 삭제하여 처리합니다.
      • 혹은, 평균이나 중앙값으로 결측값을 대체하는 등의 방법을 사용합니다.

 

  • 데이터 시각화 함수
    • 데이터를 시각화하여 탐색적 데이터 분석을 수행할 때 다양한 시각화 함수를 사용할 수 있습니다.
    • 이를 통해 데이터의 분포, 상관 관계, 이상치 등을 확인할 수 있습니다.
import matplotlib.pyplot as plt

def plot_histogram(data):
    # 히스토그램을 그리는 함수
    plt.hist(data, bins=20)
    plt.xlabel('Value')
    plt.ylabel('Frequency')
    plt.title('Histogram of Data')
    plt.show()

def plot_scatter(x, y):
    # 산점도를 그리는 함수
    plt.scatter(x, y)
    plt.xlabel('X')
    plt.ylabel('Y')
    plt.title('Scatter Plot')
    plt.show()

 

  • 참고!) 히스토그램과 산점도란 무엇인가?
    • 히스토그램은 데이터의 분포를 시각화하는 데 사용되는 그래프입니다. 연속된 데이터의 빈도를 막대 형태로 나타내어 데이터의 분포를 살펴볼 수 있습니다.

산점도는 두 변수 간의 관계를 시각화하는 데 사용되는 그래프입니다. 각각의 데이터 포인트를 점으로 나타내어 변수 간의 상관 관계를 확인할 수 있습니다. 두 변수 간의 관계를 살펴보거나 이상치를 탐지하는 데 사용됩니다.

 

 

 

  • 통계 계산 함수
    • 데이터 분석에서는 다양한 통계량을 계산해야 할 때가 있습니다.
    • 이를 위해 통계 계산 함수를 사용할 수 있습니다.
import numpy as np

def calculate_mean(data):
    # 평균을 계산하는 함수
    return np.mean(data)

def calculate_std(data):
    # 표준편차를 계산하는 함수
    return np.std(data)

def calculate_correlation(x, y):
    # 상관 관계를 계산하는 함수
    return np.corrcoef(x, y)
  • 참고!) 표준편차와 상관관계란 무엇인가?
    • 표준편차(Standard Deviation)는 데이터가 평균에서 얼마나 떨어져 있는지를 나타내는 측도입니다. 분산의 제곱근으로 계산되며, 데이터 포인트와 평균 간의 거리의 제곱의 평균의 제곱근으로 정의됩니다. 표준편차는 데이터의 분포를 측정하는 데 널리 사용되며, 분산과 함께 데이터의 변동성을 나타내는 중요한 통계적 지표입니다.

상관관계는 두 변수 간의 선형 관계의 강도와 방향을 나타내는 지표입니다. 상관관계는 -1부터 1까지의 값을 가지며, 1에 가까울수록 양의 선형 관계가 강하고, -1에 가까울수록 음의 선형 관계가 강합니다. 0에 가까울수록 선형 관계가 약하거나 존재하지 않음을 의미합니다.

 

 

 

 

나중에 공부하기 !!

 

 

3. 학습하며 겪었던 문제점 & 에러 

 

이해하기 어려웠으며, 반복 학습 필요

 

4. 내일 학습 할 것은 무엇인지 

 

SQL 코드카타 ,파이썬 강의 듣기

 

'내일배움캠프' 카테고리의 다른 글

[내일배움캠프] 12일차-1  (0) 2025.05.27
[내일배움캠프] 12일차  (0) 2025.05.27
[내일배움캠프] 11일차  (0) 2025.05.26
[내일배움캠프] 주말 공부 -2  (0) 2025.05.25
[내일배움캠프] 주말 공부 -1  (0) 2025.05.25