HoG (Histogram of Oriented Gradients)

728x90

💡 이미지를 Cell 단위로 나누어, 각 셀에서 edge의 방향과 크기 계산 후, 방향 정보를 담은 히스토그램을 정리해 local shape을 표현하는 것.

HoG는 이미지 안의 shape을 "edge direction" 분포 형태의 "압축된 의미있는 특징 벡터"로 표현하는 것.

그럼 이걸 왜 구하나?

모델에 raw 그대로 넣으면 노이즈도 많고 차원이 큰 문제가 있음.

그래서, 이미지에서 의미 있는 정보를 뽑아 "feature vector"로 변환해서 object detection 등을 수행하면 훨씬 효과적임.

이미지 각 픽셀의 수직 & 수평 gradient 계산 -> 크기 & 방향 계산.
$$G_x = I(x+1,y)-I(x-1,y), G_y = I(x,y+1)-I(x,y-1)$$
$$M(x,y) = \sqrt{G^2_x+G^2_y}, \theta (x,y) = \tan^{-1}(\frac{G_y}{G_x})$$

이미지를 Cell (e.g., 8x8 픽셀)로 나눔.
- 이 예시에서는 8x8x2 (magnitude, direction) = 128 값을 생성.
각 셀에서 모든 픽셀 방향을 일정 개수의 bin으로 양자화함.
- 9 bin으로 나눴을 때, 각 픽셀의 direction 값이 해당되는 구간에 magnitude값을 더함.
- 보통, bilinear interpolation 써서 값이 해당되는 구간에 비율을 나눠 더함.

Intro to Deep Learning (0)	2025.09.11
SIFT (Scale Invariant Feature Transform) (0)	2025.09.11

지수토리