Untitled

Clustering

유사한 특징을 가지는 데이터들을 그룹화

예)고객 세분화, 소셜 네트워크 분석, 기사 그룹 분류,…

classification 과 Clustring은 다르다.

Untitled

classification은 답이 있다면,

Untitled

Clustering은 비슷한 특징을 가진것 끼리 묶어주는것이다.

K-Means

데이터를 k개의 클러스터(그룹)로 군집화 하는 알고리즘, 각 데이터로부터 이들이 속한 클러스터의 중심점까지의 평균 거리를 계산

중심점:Centroid

Untitled

몇개로 나눌지에서 k가 몇개

Untitled

Untitled

Untitled