기술사 노트/12. 인공지능

군집분석 (Clustering)

skyand34 2026. 2. 1. 12:58

I.  유사 데이터의 그룹화, 군집분석의 정의

- 데이터를 유사성을 기준으로 군집화하고, 군집간의 유사성과 상이성을 규명하는 비지도 학습 기법

 

II. 군집분석의 프로세스와 유형

가. 군집분석의 프로세스

Hand made

나. 군집분석의 유형

구분 유형 특징
계층 분석 최단 연결법 - 두 클러스터 간의 최소 거리(가장 가까운 점들 간의 거리)를 기준으로 병합
최장 연결법 - 두 클러스터 간 최대 거리(가장 먼 점들 간의 거리)를 기준으로 병합
중심 연결법 - 각 클러스터의 중심(평균 좌표) 간의 거리를 기준으로 병합
평균 연결법 - 두 클러스터 간 모든 점들 간 거리를 평균화하여 병합
와드 연결법 - 병합으로 인해 발생하는 클러스터 내의 분산 증가를 최소화하는 방식
비계층 분석 K-Means - K개의 Centroid 선정, 각 데이터 점을 가장 가까운 중심에 할당하여 클러스터 형성
DBSCAN - Epsilon, Minpts 이용 정해진 반경내에 밀도 기반으로 군집화를 수행하는 알고리즘

 

III. Clustering과 Classification의 비교

비교 Clustering Classification
목적 패턴 발견 데이터 분류
학습 유형 비지도 학습 지도 학습
라벨 유무 없음 있음
결과 해석 사후 해석 분류 의미가 사전에 명확함

 

- 군집분석의 평가기법으로는 실루엣 계수, Elbow Method, Dunn Index 등을 사용함.

 


참고자료