빅데이터분석기사 필기/4과목 : 빅데이터 결과해석
4.2 회귀모델 평가지표
qordnswnd123
2025. 7. 14. 10:08
🧠 회귀모델 평가지표
✅ 1. 회귀 모델이란?
회귀 모델은 숫자를 예측하는 모델이에요.

👉 예측 결과가 **수치(숫자)**로 나오는 것이 회귀입니다.
✅ 2. 회귀 모델, 잘했는지 어떻게 평가할까?
모델이 예측한 숫자와, 실제 숫자가 얼마나 차이 나는지를 봐요.
- 예측값: 모델이 맞췄다고 생각한 숫자
- 실제값: 진짜 정답 숫자
- 오차(에러) = 실제값 – 예측값
✅ 3. 주요 평가 지표 7개 쉽게 설명
1️⃣ MAE (평균 절대 오차)
그냥 얼마나 틀렸는지 절댓값으로 평균
📌 공식:
MAE = (|오차1| + |오차2| + ... + |오차n|) / n
💬 예시:
- 진짜: 100, 예측: 90 → 오차 = 10
- 진짜: 80, 예측: 90 → 오차 = -10
- MAE = (10 + 10)/2 = 10
💡 특징:
- 아주 직관적
- 단위 그대로 (예: kg, 원, 점수 등)
2️⃣ MSE (평균 제곱 오차)
틀린 걸 제곱해서 평균
📌 공식:
MSE = (오차1² + 오차2² + ... + 오차n²) / n
💬 예시:
- 오차: 10, -10 → 제곱: 100, 100 → MSE = (100 + 100)/2 = 100
💡 특징:
- 큰 오차를 더 크게 반영
- 이상치에 민감
3️⃣ RMSE (평균 제곱근 오차)
MSE에 루트 씌운 값
📌 공식:
RMSE = √MSE
💬 예시:
- MSE가 100이면 → RMSE = √100 = 10
💡 특징:
- 단위가 원래 값과 같아짐 (MAE처럼 보기 쉬움)
4️⃣ MAPE (평균 절대 백분율 오차)
틀린 정도를 퍼센트로 표시
📌 공식:
MAPE = (1/n) × Σ(|오차 / 실제값| × 100)
💬 예시:
- 진짜값: 100, 예측: 90 → 오차 = 10 → 오차율 = 10%
- 진짜값: 200, 예측: 180 → 오차 = 20 → 오차율 = 10%
- MAPE = (10% + 10%) / 2 = 10%
💡 특징:
- 퍼센트로 보기 쉬움
- 실제값이 0에 가까우면 매우 커질 수 있음 → 주의
5️⃣ MPE (평균 백분율 오차)
오차를 퍼센트로 표시하되, 음수도 허용
📌 공식:
MPE = (1/n) × Σ((오차 / 실제값) × 100)
💬 MAPE와 차이점:
- MAPE는 절댓값 → 항상 양수
- MPE는 그대로 사용 → 오차 방향(과소/과대)까지 고려
6️⃣ R² (결정 계수)
모델이 얼마나 잘 설명하는지 비율로 평가
(0~1 사이 값, 1이면 완벽)
📌 공식 (이해 중심):
R² = 1 - (예측 오차 제곱합 / 전체 분산)
💬 예시:
- R² = 0.9 → 모델이 90% 잘 설명함
- R² = 0 → 설명 못함
- R² = 1 → 완벽 예측
💡 특징:
- 1에 가까울수록 모델 성능이 좋다
7️⃣ Adjusted R² (수정된 결정 계수)
변수가 많아질수록 자동으로 R² 올라가는데
그걸 보정해주는 R²
📌 왜 필요?
- 변수를 많이 넣으면 성능은 좋아지는데, 쓸모 없는 변수도 포함되면 문제
- Adjusted R²는 변수 개수(p), 데이터 수(n) 고려해서 정확도 보정
✅ 4. 예측 지표 비교표

✅ 5. 기억 쉽게! 암기 꿀팁 ✨

✅ 6. 회귀 평가 지표는 언제 쓰나요?

✅ 7. 빅분기 시험 대비 팁 🎓
- 수식보다 뜻을 정확히 이해하는 게 중요
- MAE/MSE/RMSE/MAPE 헷갈릴 땐
절댓값 → MAE / 퍼센트 → MAPE / 제곱 → MSE / 루트 → RMSE - R²가 무조건 좋다고 생각 말고, Adjusted R²도 고려
- 실제 계산문제도 출제됨 → 오차 = 실제 – 예측값 꼭 계산해보기