3.2 로지스틱 회귀 분석
✅ 1. 로지스틱 회귀란?
- 결과(종속변수)가 두 가지로 나뉘는 문제(예: 합격/불합격, 구매/비구매 등)에 사용
- 선형 회귀처럼 입력값(X)이 결과(Y)에 어떤 영향을 주는지를 분석하지만,
- Y는 **숫자(연속값)**이 아닌 **분류(0 또는 1)**임
예:
- “흡연 여부에 따라 폐암에 걸릴 확률은?”
- X: 흡연 여부 (0 또는 1)
- Y: 폐암 여부 (0 또는 1)
✅ 2. 왜 로지스틱 회귀를 쓰나요?
- 선형 회귀는 결과가 무한대까지 가는 숫자를 예측하지만,
- 로지스틱 회귀는 결과가 항상 0~1 사이의 확률값으로 표현됨
- → 그래서 0.5 기준으로 분류하기 좋음
✅ 3. 핵심 개념 요약

✅ 4. 로지스틱 회귀 공식 쉽게 풀기
✅ 5. 선형 회귀 vs 로지스틱 회귀

✅ 6. 베르누이 분포란?
- 결과가 **두 가지(0 또는 1)**인 확률 분포
- 예: 동전 던지기 (앞면: 1, 뒷면: 0)
✅ 7. 승산비 vs 상대위험도

예:
- OR = 2 → 흡연자는 비흡연자보다 폐암 걸릴 승산이 2배
- RR = 2 → 흡연자는 비흡연자보다 폐암 발생 확률이 2배
✅ 8. 로지스틱 회귀의 특징 정리
- 종속변수가 **이진형(0 또는 1)**일 때 사용
- 결과는 확률로 해석
- 베르누이 분포를 따른다고 가정
- 정규성, 등분산성 가정 필요 없음
- 오차의 평균은 항상 0이 된다
- 이상치(outlier)에 민감할 수 있음
- 예측 결과를 **분류(0/1)**로 사용할 수 있음
'빅데이터분석기사 필기 > 3과목 : 빅데이터 모델링' 카테고리의 다른 글
3.5 과적합 방지 (0) | 2025.07.08 |
---|---|
3.4 교차 검증 (0) | 2025.07.08 |
3.3 시계열 데이터 분석 (1) | 2025.07.08 |
3.1 연관 규칙 (3) | 2025.07.08 |