我怎样才能以三个一组对行进行求和?
问题描述:
我有这个数据,我想三个行的组合,1-3,4-6,7-9,10-12。在我的数据框中,我有48行和795个变量。你可以帮帮我吗?我怎样才能以三个一组对行进行求和?
我的数据帧:
X1 X2 X3 X4 X5 X6 X7 X8 X9
1 0.00 0.00 136.29 0.00 60.52 0.00 0.00 0.00 0.00
2 0.00 0.00 4658.69 0.00 0.00 1749.50 0.00 0.00 0.00
3 0.00 0.00 0.00 0.00 0.00 125.86 0.00 0.00 0.00
4 0.00 0.00 119.34 0.00 0.00 0.00 0.00 0.00 0.00
5 0.00 0.00 4674.16 2107.55 0.00 0.00 0.00 0.00 0.00
6 0.00 0.00 0.00 0.00 0.00 5689.40 0.00 0.00 0.00
7 4270.87 0.00 0.00 0.00 0.00 3275.74 0.00 0.00 0.00
8 0.00 455.04 0.00 0.00 0.00 1296.30 0.00 0.00 0.00
9 0.00 0.00 0.00 0.00 0.00 9887.52 0.00 0.00 0.00
10 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
11 0.00 0.00 0.00 0.00 2169.64 0.00 0.00 0.00 699.93
12 0.00 12524.50 0.00 0.00 0.00 0.00 0.00 0.00 0.00
这是我想要的:
X1 X2 X3 X4 X5 X6 X7 X8 X9
1 0.00 0.00 ......
2 0.00 0.00 ......
3 4270.87 455.04 ......
4 0.00 12524.50 ......
答
使用filter
基础R溶液(这是stats::filter
- 这dplyr
bulldozes如果已经加载 - 提防):
data.frame(lapply(df, function(x) filter(x, c(1,1,1), sides=1)[seq(3, nrow(df), 3)]))
# X1 X2 X3 X4 X5 X6 X7 X8 X9
#1 0.00 0.00 4794.98 0.00 60.52 1875.36 0 0 0.00
#2 0.00 0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00
#3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00
#4 0.00 12524.50 0.00 0.00 2169.64 0.00 0 0 699.93
如@alexis_laz以上?rowsum
笔记可能是优选的,因为它为它被明确定义目的,形式如下:
rowsum(data, appropriate_grouping_vector)
所以,像这样的东西:
关于正行个rowsum(dat, (1:nrow(dat) - 1) %/% 3)
# X1 X2 X3 X4 X5 X6 X7 X8 X9
#0 0.00 0.00 4794.98 0.00 60.52 1875.36 0 0 0.00
#1 0.00 0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00
#2 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00
#3 0.00 12524.50 0.00 0.00 2169.64 0.00 0 0 699.93
答
下面的代码是一个dplyr
溶液从其源(Summing columns on every nth row of a data frame in R)改性。
它通过创建一个索引变量来对行进行分组,然后将这些子集行的rowsums解决。 n
可以取任何值,前提条件是nrow(df)
可以被n
整除。
df <- data.frame(runif(30), runif(30), runif(30))
library(plyr); library(dplyr)
n <- 3
df %>%
group_by(indx = gl(ceiling(nrow(df)/n), n, nrow(df))) %>%
summarise_each(funs(sum))
答
拆分数据,然后求和:
# dummy data
df1 <- mtcars[1:12, 1:6]
# split sum combine
t(sapply(split(df1, rep(1:4, each = 3)), colSums))
答
这也将工作:
df$group <- ceiling((1:nrow(df))/3)
aggregate(. ~ group, data = df, sum)[-1]
X1 X2 X3 X4 X5 X6 X7 X8 X9
1 0.00 0.00 4794.98 0.00 60.52 1875.36 0 0 0.00
2 0.00 0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00
3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00
4 0.00 12524.50 0.00 0.00 2169.64 0.00 0 0 699.93
还参见'rowsum' - 'rowsum(数据,appropriate_grouping_vector) ' –
@alexis_laz不错的一个,太简单了! 'rowsum(df1,rep(1:4,each = 3))',考虑张贴为答案。 – zx8754
@alexis_laz - 该死的......我总是忘记'rowsum' - 一个比我的更好的解决方案。 – thelatemail