《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集

本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一书中的第1章，第1.3节，作者：（澳）Yanchang Zhao，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3　数据集

本节简单地介绍本书中将要使用到的数据集。

1.3.1　iris数据集

在许多的科研著作中都在iris数据集上做分类操作。该数据集由3种不同类型的鸢尾花的50个样本数据构成 [Frank and Asuncion，2010]。其中的一个种类与另外两个种类是线性可分离的，后两个种类是非线性可分离的。这个数据集包含了5个属性：
Sepal.Length（花萼长度），单位是cm。
Sepal.Width（花萼宽度），单位是cm。
Petal.Length（花瓣长度），单位是cm。
Petal.Width（花瓣宽度），单位是cm。
种类：Iris Setosa（山鸢尾）、Iris Versicolour（杂色鸢尾），以及Iris Virginica（维吉尼亚鸢尾）。

《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集

1.3.2　Bodyfat数据集

Bodyfat数据集由mboost包[Hothorn et al.，2012]提供。该数据集包含71行，每一行代表一个客户的信息。数据集包含10列数值型数据。
age：年龄。
DEXfat：以DXA计算的体脂重，响应变量。
waistcirc：腰围。
hipcirc：臀围。
elbowbreadth：肘宽。
kneebreadth：膝宽。
anthro3a：三项人体测量的对数和。
anthro3b：三项人体测量的对数和。
anthro3c：三项人体测量的对数和。
anthro4：三项人体测量的对数和。
DEXfat的值可通过其他的变量预测得到。

《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集

《R语言与数据挖掘最佳实践和经典案例》—— 1.3 数据集

1.3 数据集

1.3.1 iris数据集

1.3.2 Bodyfat数据集

相关推荐

《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集

1.3　数据集

1.3.1　iris数据集

1.3.2　Bodyfat数据集