R:导入read.csv与数字格式
问题描述:
其中R雷丁CSV数据,在塔11已在格式“1,022.00”数据和“516.00”,他们必须是“NUMERICS”或“双”R:导入read.csv与数字格式
dados201702 <- read.csv("dataset.csv",
header = TRUE,
sep = "\t",
dec = ".",
colClasses = c("character",
"character",
"character",
"character",
"character",
"character",
"character",
"character",
"character",
"character",
"numeric",
"character"))
我要进口11列数字或双然而出现错误:
错误扫描(文件=文件,内容=什么,月=月,报价=报价,DEC =月,扫描()预期'a real',got'1,022.00'
答
看起来好像您的数据包含1000分隔符,,
会给您带来问题。您可以在data.frame
中读取并使用gsub
转换相关的列或在下面的链接之一建议您可以定义一个新的类定义:
- How to load df with 1000 separator in R as numeric class?
- processing negative number in "accounting" format
在这里,我们定义一个删除逗号(1000分隔符)的新类。
setClass("MyNum")
setAs("character", "MyNum",
function(from) as.numeric(gsub(",", "", from)))
indata <- read.csv("tst.txt", ,
header = TRUE,
sep = "\t",
dec = ".",
colClasses=c(rep("character", 10), "MyNum", "character"))
备选地只使用as.numeric(gsub(",", "", from))
其中from
是包含分离器1000的矢量。
+0
正好,谢谢。 – user3565792
向我们展示一些与 – ekstroem
一起使用的示例数据请澄清您正在询问的内容。您可能想查看[提问指南](http://*.com/help/how-to-ask),特别是[最小,完整和可验证的示例]部分(http://*.com /帮助/ MCVE)。 –
我想导入列11作为数字或双重错误发生:“错误在扫描(文件=文件,什么=什么,SEP = SEP,报价=报价,DEC = DEC,扫描()预计'一个真正的',得到'1,022.00'“ – user3565792