I. 유사 데이터의 그룹화, 군집분석의 정의
- 데이터를 유사성을 기준으로 군집화하고, 군집간의 유사성과 상이성을 규명하는 비지도 학습 기법
II. 군집분석의 프로세스와 유형
가. 군집분석의 프로세스

나. 군집분석의 유형
| 구분 | 유형 | 특징 |
| 계층 분석 | 최단 연결법 | - 두 클러스터 간의 최소 거리(가장 가까운 점들 간의 거리)를 기준으로 병합 |
| 최장 연결법 | - 두 클러스터 간 최대 거리(가장 먼 점들 간의 거리)를 기준으로 병합 | |
| 중심 연결법 | - 각 클러스터의 중심(평균 좌표) 간의 거리를 기준으로 병합 | |
| 평균 연결법 | - 두 클러스터 간 모든 점들 간 거리를 평균화하여 병합 | |
| 와드 연결법 | - 병합으로 인해 발생하는 클러스터 내의 분산 증가를 최소화하는 방식 | |
| 비계층 분석 | K-Means | - K개의 Centroid 선정, 각 데이터 점을 가장 가까운 중심에 할당하여 클러스터 형성 |
| DBSCAN | - Epsilon, Minpts 이용 정해진 반경내에 밀도 기반으로 군집화를 수행하는 알고리즘 |
III. Clustering과 Classification의 비교
| 비교 | Clustering | Classification |
| 목적 | 패턴 발견 | 데이터 분류 |
| 학습 유형 | 비지도 학습 | 지도 학습 |
| 라벨 유무 | 없음 | 있음 |
| 결과 해석 | 사후 해석 | 분류 의미가 사전에 명확함 |
- 군집분석의 평가기법으로는 실루엣 계수, Elbow Method, Dunn Index 등을 사용함.
참고자료
- (Practicus AI) The 5 Clustering Algorithms Data Scientists Need to Know
'기술사 노트 > 12. 인공지능' 카테고리의 다른 글
| RAG (Retrieval Augmented Generation) (0) | 2026.01.20 |
|---|---|
| 메타휴리스틱스 (Metaheuristics) (0) | 2026.01.19 |
| 데이터 차원축소 (Data Dimensionality Reduction) (0) | 2026.01.18 |
| 역전파 알고리즘 (Backpropagation Algorithm) (0) | 2026.01.17 |
| CNN (Convolutional Neural Network) (0) | 2025.03.11 |