密度聚类 dbscan
层次聚类方法 |
n凝聚的层次聚类:自底向上,首先将每个对象作为一个簇,然后 合并这些原子簇为越来越大的簇,直到某个终结条件被满足。
n分裂的层次聚类:自顶向下,它首先将所有对象置于一个簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件。
n层次凝聚的代表是AGNES算法。层次分裂的代表是DIANA算法。 |
优缺点: |
n层次聚类方法是不可逆的,也就是说,当通过凝聚式的方法将两组合并后,无法通过分裂式的办法再将其分离到之前的状态,反之亦然。
n另外,层次聚类过程中调查者必须决定聚类在什么时候停止,以得到某个数量的分类。 在不必要的情况下应该小心使用层次聚类方法 |
基于密度的聚类方法
n划分和层次方法旨在发现球状簇。他们很难发现任意形状的簇。 n改进思想:将簇看作数据空间中由低密度区域分隔开的高密度对象区域。
n过滤噪声孤立点数据,发现任意形状的簇。 ¨DBSCAN:基于高密度连通区域聚类 ¨OPTICS:通过点排序识别聚类结构 ¨DENCLUE:基于密度分布函数的聚类 |
特点: •抗噪声 • 能处理任意形状聚类 |
n时间复杂度
|
n空间复杂度
|