AI 개발 공부 공간

AI, 머신러닝, 딥러닝, Python & PyTorch, 실전 프로젝트

머신러닝/머신러닝: 기초 내용

머신러닝 입문

qordnswnd123 2024. 12. 10. 12:09

1. 머신러닝의 정의

1.1 머신러닝

머신러닝은 데이터를 기반으로 패턴을 자동으로 학습하고, 입력 데이터와 출력 데이터 사이의 관계를 모델링하는 인공지능의 한 분야입니다.

수학적 모델을 사용하여 데이터를 분석하고, 데이터셋의 특징을 파악한 후 모델을 만들어 새로운 데이터에 대한 예측이나 분류를 수행합니다.

 

1.2 머신러닝의 장점

선형 모델과 같은 일부 모델의 결과는 해석이 용이하여 의사결정에 도움이 됩니다.

또한, 자동화 과정에서 반복적인 작업들을 머신러닝 모델을 통해 자동화할 수 있어 생상성과 효율성을 높일 수 있으며, 다양한 알고리즘을 선택할 수 있어 다양한 문제에 적합한 해결책을 제공할 수 있습니다.

 

1.3 주의사항

머신러닝 모델은 대량의 고품질 데이터에 크게 의존합니다.

데이터가 불충분하거나 편향되어 있으면, 모델은 잘못된 패턴을 학습하고 예측이 부정확해질 수 있습니다.

데이터 전처리와 정제과정이 필수적입니다.

과적합이 발생할 수 있습니다.


2. 머신러닝의 종류

  • 지도학습
  • 비지도학습
  • 강화학습

2.1 지도학습

지도학습은 정답을 가진 훈련 데이터를 사용하여 모델을 학습시키는 과정을 말합니다.

이 방식에서 모델은 훈련 데이터셋에서 패턴을 학습한 후, 새로운 데이터에 대해 정답을 예측하거나 분류합니다.

 

2.2 비지도학습

비지도학습은 정답이 없는 데이터를 사용하여 데이터 내의 패턴, 구조, 또는 관계를 찾는 과정입니다.

이 방식에서는 정답이 주어지지 않으므로, 모델은 데이터의 숨겨진 특징이나 구조를 스스로 탐색합니다.

예를들어 이상치 탐지, 차원 축소, 군집화가 이에 해당합니다.

 

2.3 강화학습

강화학습은 모델이 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 과정입니다.

모델이 시행착오를 통해 최적의 행동 전략을 학습합니다.

예를들어 자율주행 자동차를 개발하는 것이 여기에 속합니다.


3. 머신러닝 워크플로우(workflow)

 

 

  • 머신러닝 워크플로우는 데이터 수집부터 모델 배포까지의 전체 과정을 말합니다.
  • 데이터 수집 : 필요한 데이터를 수집하거나 생성
  • 탐색적 데이터 분석(EDA) :  데이터의 특성과 패턴을 파악
  • 데이터 전처리 : 데이터를 탐색적 분석을 통해 얻은 인사이트를 반영하거나 모델링에 적합한 형태로 변형
  • 피처 엔지니어링 : 데이터에서 유용한 피처를 선택 및 생성
  • 모델링 : 적합한 머신러닝 알고리즘을 선택해 모델 구축
  • 성능평가 : 모델 성능 검증
  • 고도화 : 모델 성능 향상

머신러닝 워크플로우의 특징 중 하나는 그 과정이 선형적이기보다는 반복적이라는 점 입니다.

각 단계는 독립적이지 않으며, 프로젝트의 진행 상황에 따라 여러 번 반복되거나 이전 단계로 되돌아 갈 수 있습니다.

이러한 반복적인 접근 방식은 프로젝트의 유연성을 높이면서 양질의 분석결과를 얻을 수 있도록 합니다.

'머신러닝 > 머신러닝: 기초 내용' 카테고리의 다른 글

데이터 불균형  (0) 2024.12.15
피처 엔지니어링 입문  (2) 2024.12.14
다변량 이상치  (0) 2024.12.13
단변량 이상치  (0) 2024.12.12
데이터 전처리 입문  (0) 2024.12.11