유사한 특징을 가지는 데이터들을 그룹화
예)고객 세분화, 소셜 네트워크 분석, 기사 그룹 분류,…
classification 과 Clustring은 다르다.
classification은 답이 있다면,
Clustering은 비슷한 특징을 가진것 끼리 묶어주는것이다.
데이터를 k개의 클러스터(그룹)로 군집화 하는 알고리즘, 각 데이터로부터 이들이 속한 클러스터의 중심점까지의 평균 거리를 계산
중심점:Centroid
몇개로 나눌지에서 k가 몇개