MS Azure, AI

[AI-900] 자격증 완벽정리 3편_머신러닝 유형(지도학습, 비지도학습, 강화학습)

axstudy 2025. 5. 6. 13:26

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 1편_개요와 준비 전략

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 2편_인공지능(AI), 머신러닝(ML), 딥러닝(DL) 개념 비교

 

목차:

  • 머신러닝 학습 방식의 분류 개요
  • 지도학습 (Supervised Learning) – 개념과 예시
  • 비지도학습 (Unsupervised Learning) – 개념과 예시
  • 강화학습 (Reinforcement Learning) – 개념과 예시
  • 시험 출제 포인트 정리 및 비교 표
  • 마무리 요약

머신러닝 학습 방식의 분류 개요

머신러닝 알고리즘은 학습 시 주어지는 데이터 형태와 피드백 방식에 따라 여러 유형으로 분류됩니다. 가장 기본적인 분류는 지도학습, 비지도학습, 강화학습 세 가지입니다. AI-900 시험에서도 이 세 가지 학습 유형의 개념과 차이를 이해하고 있는지가 중요합니다.

  • 지도학습 (Supervised Learning): 입력 데이터와 **정답 레이블(label)**이 함께 주어져, 모델이 정답을 예측하도록 학습하는 방식
  • 비지도학습 (Unsupervised Learning): 데이터에 정답 레이블이 없고, 패턴이나 군집을 찾도록 학습하는 방식
  • 강화학습 (Reinforcement Learning): 에이전트(Agent)가 환경과 상호작용하며 **보상(reward)**을 받아가며 최적의 행동 전략을 학습하는 방식

각 학습 유형마다 적용되는 문제 유형과 알고리즘이 다르며, 실생활 활용 사례도 다릅니다. 아래에서 하나씩 자세히 살펴보겠습니다.

지도학습 (Supervised Learning) – 개념과 예시

지도학습은 *“정답이 있는 데이터”*로 학습하는 머신러닝입니다. **훈련 데이터마다 타깃(label)**이라고 부르는 정답값이 존재하여, 모델이 예측한 출력과 정답을 비교하면서 학습을 진행합니다. 마치 학생이 정답지가 있는 문제를 풀면서 교정받는 것과 비슷합니다. 지도학습의 목표는 보지 않은 새로운 데이터에 대해서도 올바른 출력을 예측할 수 있도록 모델을 일반화시키는 것입니다.

지도학습에는 대표적으로 두 가지 문제 유형이 있습니다:

  • 분류 (Classification): 카테고리형 정답을 맞히는 것. 예를 들어 이메일이 "스팸/정상"인지, 이미지 속 동물이 "개/고양이"인지 분류합니다. 정답 레이블이 유한한 클래스 중 하나로 주어집니다 (스팸 or 정상 등).
  • 회귀 (Regression): 연속적인 수치형 정답을 맞히는 것. 예를 들어 내일의 주식가격 예측, 집의 면적에 따른 가격 예측 등이 회귀 문제입니다. 정답 레이블이 연속값(실수나 숫자)입니다.

예시: 지도학습의 친숙한 예로 집값 예측 모델을 생각해봅시다. 과거 부동산 데이터에서 각 집의 평수, 방 수, 위치 등의 특징(입력)과 실제 거래 가격(레이블)을 수집합니다. 이 데이터를 지도학습 알고리즘(예: 선형 회귀)에 적용하면, 입력 특징에서 집값을 예측하는 모델을 학습할 수 있습니다. 학습이 끝난 모델은 새로운 집의 평수와 방 수 등의 정보를 입력받아 예상 가격을 출력할 수 있게 됩니다.

또 다른 예로 이미지 분류를 들 수 있습니다. 수천 장의 동물 사진이 있고, 각각 "고양이" 또는 "개" 라벨이 달려있다고 합시다. 이를 이용해 딥러닝 CNN 모델을 지도학습시키면, 나중에 처음 보는 동물 사진이 입력되었을 때 그 동물이 고양이인지 개인지 분류할 수 있습니다.

출제 포인트: 시험에서는 지도학습의 개념 정의나 예시를 묻기도 하지만, 주로 지도학습에 해당하는 상황을 식별하는 문제가 나올 수 있습니다. 예를 들어, 문제지에 “다음 시나리오 중 지도 학습에 속하는 것은?” 이라는 질문과 함께 여러 사례가 주어지면, 정답이 있는 데이터를 활용하는 경우를 고르면 됩니다. (예: “과거 판매량 데이터를 활용해 다음 달 판매량을 예측” -> 과거 데이터에 정답이 있어 지도학습). 또한 분류 vs 회귀의 구분 (카테고리 예측인지 수치 예측인지)도 출제될 수 있으니 유념하세요.

비지도학습 (Unsupervised Learning) – 개념과 예시

비지도학습은 “정답 레이블 없이” 학습하는 방식입니다. 즉, 데이터에는 정답이 붙어 있지 않고, 모델은 데이터의 구조나 숨겨진 패턴을 발견하는 데 초점을 맞춥니다. 사람으로 치면, 해답지 없이 문제를 풀면서 스스로 규칙성을 찾아내는 셈입니다.

비지도학습의 대표적인 작업은 **군집화(클러스터링, Clustering)**입니다. 군집화는 비슷한 데이터끼리 묶는 작업으로, 데이터 포인트들을 몇 개의 그룹으로 나누되 각 그룹 내부의 유사도는 높이고 그룹 간 유사도는 낮게 만드는 목표를 가집니다. 대표적인 알고리즘으로 k-평균(K-means) 군집화 등이 있습니다.

또 다른 비지도학습 작업은 **차원 축소(Dimensionality Reduction)**로, 이는 데이터의 중요한 특징을 추출하여 저차원으로 표현하는 것입니다 (예: PCA 주성분 분석).

예시: 비지도학습의 흔한 사례로 고객 세분화를 들 수 있습니다. 어떤 전자상거래 기업이 수만 명의 고객 구매 데이터를 가지고 있다고 합시다. 고객들에게 "VIP", "일반", "잠재 이탈" 같은 라벨이 미리 있는 게 아니라, 그냥 행동 데이터만 존재합니다. 이 때 비지도학습의 군집화 알고리즘을 적용하면 유사한 구매 패턴을 가진 고객 군집들을 발견할 수 있습니다. 예컨대 한 군집은 매번 신상품을 구매하는 얼리어답터 그룹, 다른 군집은 할인상품만 노리는 실속파 그룹 등으로 자동 분류될 수 있습니다. 비지도학습은 이렇게 데이터를 이해하기 위한 통찰을 얻는 데 많이 활용됩니다.

다른 예로 **이상치 탐지(Anomaly Detection)**도 비지도학습으로 볼 수 있습니다. 정상 데이터의 패턴을 학습해두고, 그 패턴에서 크게 벗어나는 데이터 포인트를 찾아내는 방식입니다. 예를 들어 은행 거래 내역에서 사기 거래를 탐지할 때, 사기 레이블이 없어도 일반적인 거래 패턴과 동떨어진 이상 거래를 감지하는 식입니다.

출제 포인트: 시험에서는 "라벨 없이 데이터 패턴을 찾는 기법은?" 같은 단순 개념 문제부터 "다음 중 비지도학습의 예시로 적절한 것은?" 같은 응용 문제가 나올 수 있습니다. 주어진 사례에 정답이 주어져 있지 않다면 비지도학습임을 알아차려야 합니다. 특히 클러스터링은 비지도학습의 전형적인 예로 잘 나오는 키워드이니 기억하세요. 예를 들어 *"고객을 유사한 특징에 따라 세 그룹으로 나눴다"*라는 설명이 있다면 이는 비지도학습의 클러스터링을 말하는 것입니다.

강화학습 (Reinforcement Learning) – 개념과 예시

강화학습은 앞의 두 가지와 달리 **에이전트(Agent)**가 **환경(Environment)**과 상호 작용하며, 그 결과로 얻는 **보상(Reward)**을 최대화하도록 학습하는 방식입니다. 지도학습처럼 정답을 알려주는 사람이 있는 것도 아니고, 비지도학습처럼 정적인 데이터만 다루는 것도 아닙니다. 대신 에이전트는 매 시간순간 행동(Action)을 취하고, 환경으로부터 보상 신호를 받습니다. 이 보상이 잘 설정된 일종의 피드백으로, 에이전트는 **시행착오(trial and error)**를 통해 보상을 최대화하는 최적의 행동 전략(Policy)을 학습합니다.

강화학습은 순차적인 의사결정 문제에 많이 적용됩니다. 대표적인 예로 게임 AI를 들 수 있습니다. 체스나 바둑 같은 게임에서 승리하면 +1 보상, 패배하면 -1 보상과 같이 정해두고, 에이전트가 스스로 여러 번 게임을 두면서 학습하면 결국 이기기 위한 전략을 터득하게 됩니다. 사람의 관점에선 정답을 가르쳐준 적이 없지만, 승패라는 보상 신호를 통해 학습이 이뤄지는 것입니다.

예시: 앞서 언급한 **알파고(AlphaGo)**와 같은 바둑 인공지능은 강화학습으로 유명해진 사례입니다. 초기에는 기보 데이터를 통한 지도학습도 했지만, 이후 스스로 두는 대국을 수백만 번 반복하면서 승리 확률을 높이는 방향으로 학습(강화학습)하여 인간 최고수를 능가하는 능력을 보여줬습니다. 또 다른 예로 로봇 공학에서 강화학습이 활용됩니다. 로봇에 걷는 법을 가르칠 때, 매 걸음에서의 움직임에 따라 "앞으로 전진했다"는 보상을 주고 "넘어졌다"는 패널티를 주는 식으로 학습시키면, 로봇은 넘어지지 않고 앞으로 나아가는 행동을 강화하게 됩니다.

출제 포인트: AI-900에서는 강화학습에 대한 깊은 수식을 묻지는 않지만, 개념 이해는 필요합니다. "강화학습에서 에이전트가 얻는 신호는 무엇인가?" 같은 문제로 보상을 언급하게 하거나, "마치 아이가 스스로 시행착오를 겪으며 배우듯 학습하는 ML 기법은?" 질문으로 강화학습을 고르게 할 수 있습니다. 또한 다른 학습 유형과 혼동하지 않도록, 정답 없는 상황에서 보상으로 학습이라는 키워드를 연상하면 강화학습임을 파악할 수 있습니다.

시험 출제 포인트 정리 및 비교 표

머신러닝의 지도/비지도/강화 학습은 시험에서 단골로 비교됩니다. 다음 표는 각 학습 유형의 특징을 요약한 것입니다:

학습 유형입력 데이터학습 피드백예시 문제 유형
지도학습 특징(X) + 레이블(Y) 정답 기반 손실 함수 분류(이메일 스팸 여부), 회귀(집값 예측)
비지도학습 특징(X)만 정답 없음 (패턴 탐색) 군집화(고객 그룹화), 차원축소
강화학습 환경 상태(State) 보상/패널티 게임 플레이, 로봇 제어
 
  • 지도학습은 정답이 주어진 데이터로 학습하며, 분류/회귀 문제가 이에 속합니다learn.microsoft.com.
  • 비지도학습은 정답 없이 데이터 구조를 파악하며, 클러스터링이 대표적입니다.
  • 강화학습은 행동-보상 체계를 통해 학습하며, 순차적 결정 문제(게임, 로봇 등)에 주로 적용됩니다.

시험에서는 이들 개념을 직접 물어보거나, 예시 시나리오를 제시한 후 어떤 학습 방식인지 고르는 형태로 출제합니다. 또한 "회귀는 지도학습에 속하는가?", "군집화는 어떤 학습의 예인가?" 같은 단일 선택형 지식 문제로도 나올 수 있습니다. 반드시 각각의 정의와 사례를 명확히 구분해두세요.

마무리 요약

이번 편에서는 머신러닝의 세 가지 주요 학습 유형지도학습, 비지도학습, 강화학습을 비교했습니다. 지도학습레이블된 데이터로 학습하여 분류나 회귀를 다루고, 비지도학습비레이블 데이터로 군집화 등의 패턴 발견을 수행하며, 강화학습보상 체계를 통해 에이전트가 최적 행동을 학습합니다. AI-900 시험에서는 주어진 문제 상황이 이 중 어디에 해당하는지 식별하는 능력을 요구하므로, 각 개념의 **키워드 (정답 유무, 보상 등)**를 기억해두세요.

다음 4편에서는 인공지능의 한 분야인 **자연어 처리(NLP)**와 Azure에서 이를 구현하는 Cognitive Services에 대해 살펴보겠습니다. 특히 텍스트와 음성 데이터를 이해하고 처리하는 기술과 Azure의 관련 서비스들, 그리고 시험 출제 포인트를 정리합니다.

GPT 추천 참고자료:

  • Microsoft Learn: 기계 학습의 개념 (지도/비지도/강화학습 기본 설명)
  • Microsoft Docs: 기계 학습 기법 비교 (여러 ML 알고리즘과 지도/비지도 구분 표기)learn.microsoft.com
  • 위키백과: 지도 학습, 비지도 학습, 강화 학습 (각 학습 유형의 정의와 예시)
  • OpenAI 강화학습 블로그: Learning from Reinforcement (강화학습을 이용한 사례 소개, 영문)

 

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 1편_개요와 준비 전략

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 2편_인공지능(AI), 머신러닝(ML), 딥러닝(DL) 개념 비교