当前位置:新励学网 > 秒知问答 > 等宽聚类分箱法

等宽聚类分箱法

发表时间:2024-07-28 12:49:37 来源:网友投稿

不考虑类别信息(已知X的值而未知Y的值)。分箱(binning/split bin)方法如:等宽、等频、聚类。

(1)等宽/等距:将数值属性的值域[ , ]等分为K个区间,即 (Xmax - X min) / K。前提:数值大概服从均匀分布。

(2)等频/等深/分位数(equi-depth):和等宽类似,但它不是要求每个区间宽度一样,而是要求落在每个区间的对象数目相等。即共有M个点,每个区域含有M / K 个点。

分箱后再作数据平滑处理(smoothing)。

免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。

如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!