聚类是无监督学习中使用的一种技术,其中数据样本根据数据样本固有属性的相似性被分组到集群中。聚类也可以定义为一种将在某种程度上相似的数据项组合在一起的技术。属于同一簇的数据项在某种程度上彼此相似,而属于不同簇的数据项则不同。
CURE(使用代表的聚类)和 DBSCAN(基于密度的噪声应用空间聚类)是用于无监督学习的聚类算法。CURE 是一种基于层次的聚类技术,而 DBSCAN 是一种基于密度的聚类技术。
这些是 CURE 和 DBSCAN 之间的一些区别:
编号 | CURE 聚类 | DBSCAN 聚类 |
---|---|---|
1 | CURE Clustering代表Clustering Using Representatives Clustering。 | DBSCAN Clustering 代表具有噪声聚类的应用程序的基于密度的空间聚类。 |
2 | 它是一种基于层次的聚类技术。 | 它是一种基于密度的聚类技术。 |
3 | CURE 聚类中的噪声处理效率不高。 | DBSCAN 聚类中的噪声处理是有效的。 |
4 | 它可以处理高维数据集。 | 它不适用于高维数据集。 |
5 | 在 CURE 聚类算法中,不同的数据点密度无关紧要。 | 当数据点具有不同的密度时,它不能正常工作 |
CURE聚类架构:
DBSCAN 架构:
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/263994.html