AI 개발 공부 공간

AI, 머신러닝, 딥러닝, Python & PyTorch, 실전 프로젝트

빅데이터분석기사 필기/3과목 : 빅데이터 모델링

3.2 로지스틱 회귀 분석

qordnswnd123 2025. 7. 8. 10:26

3.2 로지스틱 회귀 분석

 

✅ 1. 로지스틱 회귀란?

  • 결과(종속변수)가 두 가지로 나뉘는 문제(예: 합격/불합격, 구매/비구매 등)에 사용
  • 선형 회귀처럼 입력값(X)이 결과(Y)에 어떤 영향을 주는지를 분석하지만,
  • Y는 **숫자(연속값)**이 아닌 **분류(0 또는 1)**임

예:

  • “흡연 여부에 따라 폐암에 걸릴 확률은?”
  • X: 흡연 여부 (0 또는 1)
  • Y: 폐암 여부 (0 또는 1)

 

✅ 2. 왜 로지스틱 회귀를 쓰나요?

  • 선형 회귀는 결과가 무한대까지 가는 숫자를 예측하지만,
  • 로지스틱 회귀는 결과가 항상 0~1 사이의 확률값으로 표현됨
  • → 그래서 0.5 기준으로 분류하기 좋음

 

✅ 3. 핵심 개념 요약

 

 

✅ 4. 로지스틱 회귀 공식 쉽게 풀기

 

 

✅ 5. 선형 회귀 vs 로지스틱 회귀

 

✅ 6. 베르누이 분포란?

  • 결과가 **두 가지(0 또는 1)**인 확률 분포
  • 예: 동전 던지기 (앞면: 1, 뒷면: 0)

 

✅ 7. 승산비 vs 상대위험도

 

예:

  • OR = 2 → 흡연자는 비흡연자보다 폐암 걸릴 승산이 2배
  • RR = 2 → 흡연자는 비흡연자보다 폐암 발생 확률이 2배

 

✅ 8. 로지스틱 회귀의 특징 정리

  • 종속변수가 **이진형(0 또는 1)**일 때 사용
  • 결과는 확률로 해석
  • 베르누이 분포를 따른다고 가정
  • 정규성, 등분산성 가정 필요 없음
  • 오차의 평균은 항상 0이 된다
  • 이상치(outlier)에 민감할 수 있음
  • 예측 결과를 **분류(0/1)**로 사용할 수 있음

'빅데이터분석기사 필기 > 3과목 : 빅데이터 모델링' 카테고리의 다른 글

3.5 과적합 방지  (0) 2025.07.08
3.4 교차 검증  (0) 2025.07.08
3.3 시계열 데이터 분석  (1) 2025.07.08
3.1 연관 규칙  (3) 2025.07.08