如何创建我自己的数据集,比如R中的默认数据集?
问题描述:
我是一位新的R用户。我非常喜欢函数data()
,它存储了许多默认的数据集,我可以随时使用和测试它们。如何创建我自己的数据集,比如R中的默认数据集?
我是否也可以将自己的数据集放在R中,就像默认数据集一样,这样我就不必每次都需要时导入它们?
答
您可以使用下面的工作流程:
- 把你的数据(例如mydataset.CSV)在项目中的
data
文件夹。 - 将一个名为mydataset.R的加载的R文件放在同一个文件夹中。
- 当你想使用
data
功能,首先设置工作目录 使用setwd
项目文件夹中,然后调用data(mydataset, package=character(0))
下面是一个例子将R脚本可以看起来怎么样:
# this code goes into mydataset.R
mydataset <- local({
dat <- read.csv("mydataset.Csv")
# some transformations here if necessary
return(dat)
})
如果你想成为工作目录不可知论者,你应该考虑把你的数据放在你自己的包里。可能devtools
包是一个选项。
嗨@平,你说得对。我不问如何使用data()和read.csv(),我知道如何使用它们。我只想创建自己的数据集,比如默认数据集,这样我就不需要每次都导入它们。我希望我可以在不考虑我当前的工作路径和数据集文件路径的情况下调用我的数据集,而只需使用我的数据集(my_own_dataset)。 – xirururu