본문 바로가기

인공지능(AI)

이미지와 음성 패턴 인식 (2)

반응형

1-2 이미지 인식

컴퓨터 비전(Computer Vision)

  • 픽셀로 구성된 디지털 이미지를 기계가 이해할 수 있게 만드는 연구 영역
  • 이미지 인식이 중요함

디지털 이미지의 표현

컴퓨터 비전의 처리 과정

  • 화상 처리 단계(Image Processing Stage): 화상을 이용하기 쉬운 형태로 변경한 후 다양한 필터링을 이용해 잡음을 줄이고 이미지를 구분하기 위한 선의 식별 및 영역 발견의 작업을 수행하는 것
  • 배경 분석 단계(Scene Analysis Stage): 화상에 필요한 정보를 생성해내는 단계

컴퓨터 비전의 연구 분야 및 관련 기술

  • 이미지 인식을 포함하는 컴퓨터 비전의 궁극적인 목적은 정지 이미지와 정지 이미지의 연속 데이터인 동영상이 무엇을 의미하는지를 자동으로 분석하는 것
  • 사물이나 문자의 식별과 인식
  • 음영에서 3차원 모델의 구축
  • 사진 설명문 생성
  • 동영상 장면의 의미 추정

이미지 인식 알고리즘

  • 주어진 이미지의 경계선 정보를 이용하는 방법으로 SIFT, HOG 알고리즘
  • 주어진 이미지의 영역 간의 밝기 차를 이용하는 방법으로 Haar Features, Ferns, LBP, MCT 알고리즘
  • 딥러닝 이용

SIFT(Scale Invariant Feature Transform)

  • 이미지의 크기와 회전에서 변하지 않는 특징을 추출하는 알고리즘
  • 수행 절차
    • Scale Space 만들기
    • Difference of Gaussian(DoG) 연산 수행
    • Key Point 찾기
    • 나쁜 Key Point 제거
    • Key Point에 방향 할당
    • 최종적으로 SIFT의 특징 산출

HOG(Histogram of Oriented Gradient)

  • 대상 영역을 일정 크기의 셀로 분할하고, 셀마다 Edge 픽셀(Gradient Magnitude가 일정값 이상인 픽셀)의 방향에 대한 히스토그램을 구한 후 히스토그램 바이너리 값을 이렬로 연결 한 벡터

  • 템플릿 매칭과 히스토그램 매칭의 중간 단계에 있는 매칭 방법
    • 템플릿 매칭: 원래 영상의 기하학적 정보를 그대로 유지하면서 매칭을 수행하는 방법
    • 히스토그램 매칭: 대상의 형태가 바뀌어도 매칭할 수 있지만, 대상의 기하학적인 정보는 잃어버리고 분포 정보만을 가져 잘못된 대상과도 매칭 되는 문제 있음
  • HOG는 물체의 형태 변화가 심하지 않고 윤곽선을 식별할 수 있는 경우, SIFT는 액자 그림처럼 내부 패턴이 복잡하고 특장점이 풍부한 경우 적합

Haar Features

  • 영상의 영역과 영역의 밝기 차를 이용한 방법
  • 영역 내부에서의 형태 변화, 위치 변화에 대응 가능
  • 이미지가 갖고 있는 잡음에 강하고 속도가 빠름
  • 이미지의 대비 변화, 광원의 방향 변화, 회전 변화 검출 어려움

Ferns

  • 영상에서 특장점을 뽑고, 각 특장점을 중심으로 지역 반점(Local Patch) 내에서 임의의 2점을 잡은 후 '2점의 픽셀 밝기 차이가 +인지 - 인지'를 특징으로 사용

LBP(Local Binary Pattern)

  • 영상의 모든 픽셀에 대해 계산되는 값
  • 각 픽셀의 주변 3x3 영역의 상대적인 밝기 변화를 이진수로 코딩한 인덱스 값

MCT(Modified Census Transform)

  • 얼굴 검출 분야에서 가장 대표적인 알고리즘
  • 영상에서 한 픽셀에 대한 CT는 그 픽셀 주변 영역의 밝기 변화를 중심 픽셀보다 밝으면 0, 어두우면 1로 설정하고, 그 결과를 비트 스트링으로 연결한 값
  • 중심펙셀에도 0 또는 1을 부여할 수 있도록 개선한 것

딥러닝 이용

  • 주어진 이미지의 경계선 정보를 이용: SIFT, HOG
  • 주어진 이미지의 영역 간 밝기 차를 이용: Haar Features, Ferns, LBP, MCT

 

 

 

 

※ 해당 내용은 <인공지능 바이블>의 내용을 토대로 학습하며 정리한 내용입니다.

반응형

'인공지능(AI)' 카테고리의 다른 글

자연어 처리 (1)  (0) 2023.06.05
이미지와 음성 패턴 인식 (3)  (0) 2023.06.04
이미지와 음성 패턴 인식 (1)  (0) 2023.06.02
인공지능 모델의 평가  (0) 2023.06.01
딥러닝 (3)  (0) 2023.05.31