K-means 클러스터링

알고리즘 설명
—————————————————
1. 임의의 k개 중심점 선정
2. n개 점에 대해서 k개 중심점과의 거리 계산
3. 각 점을 가장 가까운 중심점의 클러스터에 배정
4. 각 클러스터의 가상의 중심점을 평균으로 계산
5. 다시 1번으로 되돌아가 실행
————————————————-
==> 복잡도 O(n^3)

구현시 Tip
————————————————-
* 중심점 잡기
처음 잡은 점에서 가장 먼것 선정, 그다음은 이전 두점과 가장 먼 점을 선정

* 클러스터 개수 줄이기
중심점이 가깝게 잡히는 클러스터를 병합

* 절대좌표가 아닌 경우
그래프로 보고 그래프 중심점을 구한다

* cos 함수로 거리 비교를 할 때
벡터의 합을 총 길이(절대값)으로 나눈다
= 시그마x / | 시그마x | 
————————————————-

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중

%d 블로거가 이것을 좋아합니다: