如何计算描述性统计
我有类的数据框,包含名称,性别(女性,男性)和身高的变量。我需要根据性别计算高度变量的描述性统计。我想在输出中的以下内容,任何帮助将不胜感激。如何计算描述性统计
Gender
,Freq
,Mean
,Median
,Mode
,Std
,Dev
,min
,max
尝试使用此
# assuming df is your data.frame and gender, height are column names
tapply(df$height, df$gender, function(grp) c(Freq = length(grp), mean = mean(grp),mode = mode(grp),SD = sd(grp),min = min(grp),max = max(grp)))
功能summarise()
从包dplyr
将是一个很好的解决方案:
library('dplyr')
df %>%
na.omit %>%
group_by(gender) %>%
summarise(Freq = n(), #unshure, maybe n()/NROW(df)
Mean = mean(height),
Median = median(height),
Mode = moda(height),
Std.Dev = sd(height),
min = min(height),
max = max(height))
凡moda(x)
是功能estimatin模式用于从连续可变样品:
moda <- function(x, na.omit = TRUE){
if (na.omit) x <- na.omit(x)
d <- density(x)
return(d$x[which.max(d$y)])
}
谢谢你安德烈Kolyadin –
在我的数据高度变量有缺失值,所以得到错误 summarise_impl(.data,点)错误:'x'包含缺失值 是否可能提及如果条件在上述过程 –
作出一些编辑,现在应该工作 –
提供一个[再现的](http://*.com/questions/5963269/how-to-make-a-great-r - 可重复的例子)的例子。 – Prradep
没有数据?没有例子?请遵循如何发布问题的指导原则。谢谢 –
你做了什么研究? – Elin