본문 바로가기
IT공부방

[AI-900] 자격증 완벽정리 5편_컴퓨터 비전 개념과 Azure 적용

by TechDayNote 2025. 5. 7.

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 1편_개요와 준비 전략

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 2편_인공지능(AI), 머신러닝(ML), 딥러닝(DL) 개념 비교

2025.05.06 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 3편_머신러닝 유형(지도학습, 비지도학습, 강화학습)

2025.05.06 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 4편_자연어 처리(NLP)와 Azure Congnitive Service

 

 

목차:

  • 컴퓨터 비전이란? (이미지와 비디오 이해하기)
  • 컴퓨터 비전의 주요 과제 (분류, 검출, OCR 등)
  • Azure의 비전 관련 서비스 소개 (Azure AI Vision 등)
  • 실무 활용 예시 (예: 이미지 분류 앱, OCR 활용)
  • 출제 포인트 정리 및 마무리

컴퓨터 비전이란? (이미지와 비디오 이해하기)

**컴퓨터 비전(Computer Vision)**은 이미지나 영상에서 의미있는 정보를 추출하는 기술을 통칭합니다. 쉽게 말해, 사람의 시각적 인지 능력을 컴퓨터에게 부여하는 AI 분야입니다. 컴퓨터 비전 기술을 통해 컴퓨터는 사진 속 사물을 인식하고, 사람 얼굴을 찾아내고, 동영상에서 객체의 움직임을 추적하는 등의 작업을 수행할 수 있습니다.

우리 일상에서 컴퓨터 비전은 이미 널리 쓰이고 있습니다. 스마트폰의 얼굴 인식 잠금 해제, 차량의 운전자 보조 시스템(차선 인식, 보행자 감지), 공장의 불량품 자동 검수(영상 분석), 쇼핑 앱의 이미지 검색 등 다양한 사례가 있죠. 이러한 응용들이 가능하도록, 이미지 데이터에 대한 강력한 인식 능력을 제공하는 것이 컴퓨터 비전 기술의 목표입니다.

AI-900 시험에서는 컴퓨터 비전이 하나의 영역으로 출제되며 (15~20% 비중), 주로 CV의 과제 유형Azure의 비전 서비스를 묻습니다learn.microsoft.comlearn.microsoft.com. 따라서 기본 개념과 함께 Azure Cognitive Services에서 지원하는 시나리오를 이해하는 것이 중요합니다.

컴퓨터 비전의 주요 과제 (분류, 검출, OCR 등)

컴퓨터 비전에서 흔히 다루는 핵심 과제들은 다음과 같습니다learn.microsoft.com:

  • 이미지 분류(Image Classification): 입력 이미지에 대해 가장 우세한 객체나 장면의 카테고리를 식별하는 작업입니다. 예를 들어 사진을 보고 "개", "고양이", "자동차" 등의 라벨 중 해당되는 것을 하나 출력하는 것입니다. 일반적으로 이미지를 하나의 범주로 분류하지만, 경우에 따라 여러 라벨을 예측하는 멀티라벨 분류도 있습니다. Azure AI Vision 서비스의 이미지 분석 기능은 기본적인 분류 태스크(태그 생성)를 수행합니다.
  • 객체 검출(Object Detection): 이미지 내에 여러 객체가 있을 때, 각 객체의 위치(경계 상자)와 종류를 찾아내는 작업입니다learn.microsoft.com. 예를 들어 교통 카메라 영상에서 자동차, 사람, 신호등 등을 찾아 각각의 위치를 표시하고 분류하는 것이 객체 검출입니다. Azure Custom Vision 서비스는 객체 검출 모델 트레이닝을 지원하며, Azure AI Vision 서비스도 일부 사전 모델로 일반 객체 검출을 제공합니다.
  • 얼굴 인식(Facial Recognition): 인간의 얼굴을 특수한 객체로 다루어, 얼굴을 탐지하고 신원을 확인하거나 감정, 나이 등 속성을 분석하는 작업입니다. Azure에서는 얼굴 API를 통해 얼굴 탐지, 비교, 확인 기능을 제공하며, AI-900에서는 얼굴도 컴퓨터 비전 워크로드의 하나로 다뤄집니다learn.microsoft.com. (시험에서는 얼굴 인식 기술의 윤리적 이슈나 제약도 가볍게 언급될 수 있습니다.)
  • 광학 문자 인식(OCR, Optical Character Recognition): 이미지에서 **텍스트(문자)**를 읽어내는 기술입니다learn.microsoft.com. 사진에 찍힌 간판 글씨, 문서 스캔 이미지 속 글자 등을 컴퓨터가 식별하여 텍스트 데이터로 추출합니다. Azure AI Vision 서비스에는 OCR 기능이 있고, 특히 문서 처리에 특화된 Azure Form Recognizer(Document Intelligence) 서비스도 있습니다.
  • 이미지 생성과 변환: (AI-900 핵심은 아니지만 언급) 예를 들어 스타일 변환(한 그림의 화풍을 다른 그림에 입히기)이나, 최근 주목받는 텍스트-투-이미지(prompt에 따라 이미지를 생성하는 모델, ex: DALL-E) 등도 컴퓨터 비전 분야의 응용입니다. Azure에서는 이러한 최신 모델들을 Azure OpenAI나 Custom Vision을 통해 활용 가능하지만, 시험 범위의 중심은 아닙니다.
  • 영상 분석(Video Analysis): 다수 프레임으로 구성된 동영상에서 객체 추적, 장면 전환 검출, 모션 인식 등을 수행하는 것입니다. Azure Cognitive Services의 Video Analyzer(이전 서비스, 현재 일부 통합)는 이런 기능을 지원했습니다. 시험에서는 깊이 다루진 않지만, 실시간 CCTV 분석 같은 응용으로 간략히 언급될 수 있습니다.

출제 포인트: 시험 문제는 보통 "어떤 비전 과제에 해당하는가?"를 사례와 함께 묻습니다. 예를 들어, "공장 컨베이어 벨트에서 제품 이미지들을 분석해 불량품(결함)을 찾아내고자 한다. 이는 어떤 컴퓨터 비전 작업에 속하는가?" 라고 하면 객체 검출 또는 이미지 분류로 볼 수 있겠죠. (불량 여부 이진 분류일 수 있고, 또는 이미지 내 결함 부위를 찾는 검출일 수도 있습니다.) 또 "사진에서 손으로 쓴 숫자를 인식하여 디지털 텍스트로 변환" = OCR임을 알아맞히는 문제 등도 예상됩니다.

특히 이미지 분류 vs 객체 검출 vs OCR vs 얼굴 인식은 개념을 확실히 구분해두세요. Azure 서비스도 이에 맞춰 전문화되어 있습니다 (Vision API, Custom Vision, Face API, Form Recognizer 등).

Azure의 비전 관련 서비스 소개 (Azure AI Vision 등)

Microsoft Azure는 컴퓨터 비전 기능을 쉽게 구현할 수 있도록 Azure Cognitive Services 내 여러 비전 관련 서비스를 제공합니다learn.microsoft.comlearn.microsoft.com:

  • Azure AI Vision 서비스 (구명: Computer Vision API): Azure에서 이미지 분석 전반을 담당하는 서비스입니다. 사전 구축된 AI 모델을 활용하여 이미지의 주요 태그 추출, 카테고리 분류, 객체 검출, OCR, 유명인 인식, 색상/성별 분석 등을 수행할 수 있습니다. 예를 들어 한 장의 사진을 Vision API에 보내면, "야외", "사람 2명", "웃고 있음" 등 태그와 함께, 그 사진에 대한 캡션(요약 설명)까지 얻을 수 있습니다. OCR 기능도 Vision API에 포함되어, 인쇄된 텍스트를 읽거나 필기체를 인식할 수 있습니다learn.microsoft.com.
  • Azure AI Face 서비스: 얼굴에 특화된 인지 서비스입니다. 얼굴 탐지 (이미지에서 얼굴 위치 찾기), 인증(Verification) (두 얼굴 이미지가 같은 사람인지 확인), 식별(Identification) (여러 등록된 인물 중 이미지 속 사람이 누구인지 찾기) 등을 제공합니다. 또한 얼굴에서 감정 추론이나 특징(나이 추정, 안경 착용 여부 등)도 함께 분석합니다. AI-900에서는 Face API가 얼굴 인식 서비스 예시로 언급될 수 있습니다learn.microsoft.comlearn.microsoft.com.
  • Azure Custom Vision: 사용자가 자신만의 이미지 분류기나 객체 검출 모델을 훈련시킬 수 있는 서비스입니다. 위의 Vision API는 사전 학습된 범용 모델이지만, Custom Vision을 쓰면 예를 들어 “결함있는 제품” vs “정상 제품” 분류기 같은 도메인 특화 모델을 소량의 예시 이미지로 쉽게 만들어 배포할 수 있습니다. UI를 통해 이미지에 라벨 붙이고 학습시키면, 곧장 예측 API를 사용할 수 있어 편리합니다. 시험에서는 Custom Vision 언급이 많진 않겠지만, 사용자 정의 비전 모델에 대해 물으면 이 서비스를 떠올리면 됩니다.
  • Azure Form Recognizer (Document Intelligence): 이는 문서 이미지(PDF 등)에서 구조화된 데이터를 추출하는 서비스입니다. 예컨대 영수증 사진에서 상호, 날짜, 금액 등을 뽑아내는 일, 명함 이미지를 스캔해 이름/회사/연락처를 추출하는 일 등을 합니다. OCR의 특수한 확장이라고 볼 수 있죠. AI-900에는 "문서 처리 워크로드"라는 말이 나오는데, 이는 바로 이런 Form Recognizer 시나리오를 가리킵니다learn.microsoft.com. 시험에서 "OCR과 추가 구조 추출까지 해주는 Azure 서비스는?" 식으로 물으면 Form Recognizer가 답입니다.

출제 포인트: Azure 비전 서비스 관련 문제는 *"어떤 서비스를 써야 하는가"*가 자주 등장합니다. 예를 들어, "다수 사람 얼굴을 인식하고자 한다. Azure Cognitive Services 중 어떤 것을 사용하면 되는가?" => Azure AI Face 서비스. 또는 "사진에서 글자를 읽어 텍스트로 변환하려 한다. 어떤 Azure 서비스를 활용할 수 있는가?" => Azure AI Vision(OCR) 혹은 Form Recognizer. 문맥에 따라 일반 이미지 OCR이면 Vision API, 서식 있는 문서라면 Form Recognizer가 적절하겠죠.

또 "사용자 정의 이미지 분류 모델을 만들고 배포하는 가장 쉬운 방법은?" => Custom Vision을 떠올리면 됩니다. Azure Portal에서 Custom Vision을 사용하면 모델링에 대한 깊은 지식 없이도 커스텀 분류기가 가능하다는 점이 특징입니다.

정리하면, Azure에서는 사전 학습된 API(Vision, Face)와 사용자 학습 서비스(Custom Vision, Form Recognizer Custom 모델)로 컴퓨터 비전을 지원하며, 시험에서는 주어진 시나리오에 알맞은 서비스 매칭을 묻습니다.

실무 활용 예시 (예: 이미지 분류 앱, OCR 활용)

  • 이미지 분류 앱: 한 박물관에서 방문객들이 작품을 촬영하면 작품 정보를 알려주는 앱을 만든다고 합시다. 이 경우 각 작품(그림 또는 조각상)을 인식해야 하는데, 일반적인 사전 학습 모델에는 그런 범주가 없겠죠. 박물관은 Custom Vision 서비스를 사용해 각 작품 사진을 라벨링하고 커스텀 분류 모델을 학습시킬 수 있습니다. 앱에서는 촬영된 사진을 그 모델에 보내 인식된 작품명과 설명을 보여줄 수 있습니다. 이 예시는 Custom Vision의 활용이미지 분류 개념을 함께 보여줍니다.
  • 실시간 객체 검출 (CCTV): 한 교차로에 지능형 CCTV를 설치하여 실시간 교통량 모니터링을 한다고 합시다. 카메라 영상에서 차량과 보행자를 검출하여 카운트하거나 위험 상황(보행자 무단횡단 등)을 감지할 수 있을 겁니다. 이 경우 객체 검출 모델이 필요하며, Azure IoT Edge 장비나 클라우드에서 Custom Vision으로 훈련된 모델을 배포해 사용할 수 있습니다. AI-900에서는 IoT까지 깊게 묻지는 않지만, 객체 검출 시나리오로써 알아두면 좋습니다.
  • OCR 및 자동화: 한 은행이 과거 종이 문서들을 디지털화하려고 합니다. 수만 건의 신청서 스캔 이미지에서 고객명, 계좌번호 등 필드 데이터를 추출하려면 OCR + 폼 인식이 필요합니다. Azure Form Recognizer를 활용하면 서식 있는 문서의 각 필드를 AI가 추출하고, 사람이 일일이 수작업으로 입력할 필요를 크게 줄일 수 있습니다. 이처럼 OCR 기술의 가치는 업무 자동화(RPA) 측면에서도 매우 높습니다. 시험에서도 "OCR" 용어를 보면 컴퓨터 비전임을 인지해야 하고, Azure 서비스로 Computer Vision API 또는 Form Recognizer를 생각하면 됩니다.

출제 포인트 (응용): 이러한 예시들은 시험의 시나리오형 질문 배경이 될 수 있습니다. 질문 자체는 "어떤 서비스 or 어떤 AI 작업이 필요한가?"일 것이므로, 키워드에 주목하세요. 사진에서 글자 추출 -> OCR, 여러 물체 위치 식별 -> 객체 검출, 그림이 개 또는 고양이인지 판별 -> 이미지 분류, 얼굴 인증으로 출입 통제 -> Face API, 영수증 자동 처리 -> Form Recognizer... 등으로 연결 지으면 됩니다.

출제 포인트 정리 및 마무리

컴퓨터 비전 분야는 시각 데이터를 다루는 AI로 요약되며, 이미지 분류, 객체 검출, OCR, 얼굴 인식 등이 핵심 과제입니다learn.microsoft.com. Azure에서는 Azure AI Vision, Face 서비스, Custom Vision, Form Recognizer 등의 서비스를 통해 이러한 과제를 해결합니다learn.microsoft.com. 출제 포인트: 예시 시나리오에 대해 "이것은 어떤 종류의 비전 작업인가?" 또는 "어떤 Azure 서비스를 사용해야 하는가?"를 묻는 문제가 자주 나옵니다. 따라서 각 작업의 정의와 해당 서비스명을 짝지어 기억하는 것이 중요합니다.

다음 6편에서는 대화형 AI(Conversational AI) 주제로, 챗봇과 이를 구현하는 Azure Bot Service에 대해 알아보겠습니다. 사람과 대화하는 AI의 개념과 기술 스택, Azure에서의 구성 요소를 살펴보며 출제 포인트를 정리해보겠습니다.

GPT 추천 참고자료:

  • Microsoft Learn: Azure에서 컴퓨터 비전 소개 (이미지 분석과 Azure Vision 서비스 설명)
  • Microsoft Docs: Azure AI Vision 서비스 (이미지 분석 API 기능 소개)learn.microsoft.com
  • Microsoft Docs: Azure Face API (얼굴 인식 서비스 설명)learn.microsoft.com
  • Microsoft Docs: Form Recognizer (문서 AI 서비스 개요)
  • MS Learn Blog: Custom Vision으로 자신의 이미지 분류 모델 만들기 (실습 가이드)

 

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 1편_개요와 준비 전략

2025.05.05 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 2편_인공지능(AI), 머신러닝(ML), 딥러닝(DL) 개념 비교

2025.05.06 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 3편_머신러닝 유형(지도학습, 비지도학습, 강화학습)

2025.05.06 - [MS Azure, AI] - [AI-900] 자격증 완벽정리 4편_자연어 처리(NLP)와 Azure Congnitive Service