当前位置:新励学网 > 秒知问答 > 聚类分析的标准是什么

聚类分析的标准是什么

发表时间:2024-07-28 00:44:34 来源:网友投稿

均一性:一个簇只包含一个类别的样本则没满足均一性;其实也可以认为就是正确率(每个 聚簇中正确分类的样本数占该聚簇总样本数的比例和)

完整性:同类别样本被归到同一个簇中则满足完整性

兰德指数:

兰德指数(Rand index)需要给定实际类别信息CC,假设KK是聚类结果,aa表示在CC与KK中都是同类别的元素对数,bb表示在CC与KK中都是不同类别的元素对数,则兰德指数为:

其中数据集中可以组成的总元素对数,RI取值范围为[0,1][0,1],值越大意味着聚类结果与真实情况越吻合。

对于随机结果,RI并不能保证分数接近零。为了实现“在聚类结果随机产生的情况下,指标应该接近零”,调整兰德系数(Adjusted rand index)被提出,它具有更高的区分度。

免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。

如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!