반응형
인공지능 학습 방법 중에서 가장 중요한 세 가지,
지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)
이 세 가지를 쉽고 명확하게 정리해드릴게요.
✅ 인공지능 학습 방법 3가지
구분지도학습비지도학습강화학습
| 🌟 핵심 개념 | 정답(라벨)이 있는 데이터를 학습 | 정답 없이 데이터 구조를 학습 | 보상(Reward)을 통해 스스로 학습 |
| 🎯 목표 | 정확한 예측 | 패턴 발견 | 보상을 최대화하는 행동 선택 |
| 📘 예시 | 사진 → 고양이/개 분류, 집값 예측 | 고객 군집화, 추천 시스템 | 알파고, 로봇, 게임 에이전트 |
| 💡 학습 방식 | 입력과 정답을 쌍으로 제공 | 입력만 제공하고 유사한 것끼리 묶음 | 시행착오를 통해 스스로 경험 |
1️⃣ 지도학습 (Supervised Learning)
✔ 정의:
정답이 있는 데이터로 학습하여, 새로운 입력에 대해 정답을 예측하는 모델
🧠 예:
- "이 사진은 강아지야!" (이미지 + 정답)
- "이 집은 2억이야!" (특성 + 정답가격)
🔍 종류:
- 분류(Classification): 카테고리 예측 (ex. 스팸메일 vs 일반메일)
- 회귀(Regression): 숫자 예측 (ex. 내일 기온, 집값)
2️⃣ 비지도학습 (Unsupervised Learning)
✔ 정의:
정답 없이 데이터만 보고, 패턴이나 구조를 스스로 찾아내는 학습
🧠 예:
- "고객들을 비슷한 특성끼리 묶어줘" (군집화)
- "이상한 거래를 찾아줘" (이상치 탐지)
🔍 종류:
- 군집화(Clustering): 유사한 것끼리 그룹 묶기 (예: 고객 분석)
- 차원 축소(Dimensionality Reduction): 중요한 정보만 추출 (예: 이미지 압축)
3️⃣ 강화학습 (Reinforcement Learning)
✔ 정의:
정답도 없고, 즉각적인 힌트도 없지만, **보상(Reward)**을 받으며 스스로 경험을 통해 최적의 행동을 학습
🧠 예:
- 알파고: 체스, 바둑에서 승리하면 +점수
- 로봇청소기: 장애물 피하고 청소 다 하면 +점수
🔁 특징:
- 행동(Action) → 결과(State) → 보상(Reward) → 다시 시도
- 시행착오(trial & error)를 통해 점점 똑똑해짐
🎯 한 줄 요약
종류한 줄 설명
| 지도학습 | "정답을 보고 배우는 학습" |
| 비지도학습 | "정답 없이 스스로 구조를 파악하는 학습" |
| 강화학습 | "보상을 받으며 스스로 경험하고 배우는 학습" |
반응형
'인공지능개념' 카테고리의 다른 글
| 인공지는 최적화 함수 비교 (2) | 2025.06.13 |
|---|---|
| 인공지능 손실함수 종류 쉽게 이해하기 (1) | 2025.06.12 |
| 인공지능이 데이터를 학습하는 방식 (0) | 2025.06.11 |
| 인공지능 개념 - 벡터 vs 텐서 (0) | 2025.06.10 |
| 머신러닝 vs 딥러닝 (2) | 2025.06.09 |