목록소프트웨어/Datamining (2)
julia coding story

□ Main Idea - 데이터 개체를 여러 수준의 중첩된 분할(tree of cluster)로 Division or merge - Hierarchical Methods는 두가지의 방법이 있다. - 아래의 사진처럼 agglomerative(AGNES)는 작은 cluster에서 merge하는 방식(bottom-up approach)이고, 다른 한가지의 방법은 divisive(DIANA)이다. 이는, 전체 cluster를 division하는 방식(top-down approach)이다. □ Process of AGNES (Agglomerative Nesting) 1. Create inital cluster(초기 클러스터 만들기) : 1) 하나의 object로 된 cluster를 만든다. 2. Merge clu..
□ k-Medoids의 용어 - medoid : 클러스터중에 k(클러스트할 개수)개를 골라 중심점으로 잡은것 - non-medoid: medoid가 아닌 점(데이터값) □ k-Medoids의 Main idea - k-means 와 비슷한 과정이다. - Partition-Based Methods 중 하나이다. - 개체의 평균을 각 군집의 중심으로 취하는 대신, 군집에서 가장 중앙(중앙값)에 위치한 개체인 medoid를 사용함 (k-means와 다른점) - k-medoid는 여러 점(데이터) 중에서 고른다. (k-means와 다른점) - 군집의 무게 중심을 구하기 위해 데이터의 평균 대신 중간점(medoids)을 사용 (k-means보다 이상치에 건강한 성능을 보임) □ k-Medoids의 Process 1..