차근차근/OpenCV

K-평균 알고리즘(K-means algorithm)

예쁜꽃이피었으면 2014. 8. 8. 10:17

http://darkpgmr.tistory.com/125 이 곳의 

다크프로그래머님의 bag of words기법에 관한 글을 읽다가

나온 K-means algorithm. 뭔가 싶어서 찾아봤다.



우선 위키피디아 - 

http://ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98


[SPSS Clementine] K - means Clustering - 

http://blog.naver.com/pjc1349/20057343166

- 거리에 기반을 둔 clustering기법

- 기준점에 가까운 곳의 데이터들을 하나의 군집으로 묶는 방법


-수행과정

 ·임의의 k개의 군집수와 위치설정

 ·가각의 데이터에 대해 k개의 위피까지의 거리를 구하고 가장 가까운 군집에 소속

 ·군집으로 나뉘어진 데이터를 기준으로 군집중앙의 위치를 제 설정

 ·새롭게 구한 군집중앙의 위치가 기존과 동일하면 알고리즘 종료 ,  다르면 두번째부터 재수행


- 이 과정을 통해 k개의 군집으로 데이터를 구분. k값에 따라 clustering에 많은 영향을 받음


-데이터 처리방시에 따른 두가지 training방식

· Infinite training : 집단중심정에 대한 정보를 지속적으로 변화시키면서 추가적으로 들어오는 모든 데이터에 대하여 반복적으로 재     해석하여 집단 중심점을 재 파악하고, 모든 데이터의 소속을 수정하면서 진행하는 방식

·Finite training : 일정량의 데이터를 미리 주고, 주어진 데이터를 토대로 집단 중심점과 데이터들의 소속을 결정하고 난 후에는 추가로 들어오는 데이터에 대해서는 고정된 중신점 정보를 이용해 소속을 결정짓는 방식


-단점

· 초기 조건에 따라 매우 판이한 결과제공

 ~ : 초기 중심점 위치 & 집단의 수

· 데이터의 모든 정보를 동일한 가중치로 계산함으로써 데이터 분별력이 약함

 ·clustering의 단위가 거리값을 이용함에 따라 집단의 형태가 '원'의 형태를 띄고 그에 따라 각원에 속하지 못하는 데이터가 발생할 수 있다.


[OpenCV] K-Means Clustering -

http://blog.naver.com/hextrial?Redirect=Log&logNo=220066302180


k-means clustering 알고리즘  -

http://blog.naver.com/kimyun_0225/130085906852


K-Means (K-평균) 군집 알고리즘 소개 -

http://ai-times.tistory.com/158


 데이터 마이닝 테크닉 - K-평균 알고리즘 -

http://adeuxist.egloos.com/971452


반응형