我怎样才能以三个一组对行进行求和?

问题描述:

我有这个数据,我想三个行的组合,1-3,4-6,7-9,10-12。在我的数据框中,我有48行和795个变量。你可以帮帮我吗?我怎样才能以三个一组对行进行求和?

我的数据帧:

 X1  X2  X3  X4  X5  X6  X7  X8  X9  
1  0.00  0.00 136.29 0.00 60.52 0.00  0.00 0.00 0.00 
2  0.00  0.00 4658.69 0.00 0.00 1749.50  0.00 0.00 0.00 
3  0.00  0.00 0.00 0.00 0.00 125.86  0.00 0.00 0.00 
4  0.00  0.00 119.34 0.00 0.00 0.00  0.00 0.00 0.00 
5  0.00  0.00 4674.16 2107.55 0.00 0.00  0.00 0.00 0.00 
6  0.00  0.00 0.00 0.00 0.00 5689.40  0.00 0.00 0.00 
7 4270.87  0.00 0.00 0.00 0.00 3275.74  0.00 0.00 0.00 
8  0.00 455.04 0.00 0.00 0.00 1296.30  0.00 0.00 0.00 
9  0.00  0.00 0.00 0.00 0.00 9887.52  0.00 0.00 0.00 
10 0.00  0.00 0.00 0.00 0.00 0.00  0.00 0.00 0.00 
11 0.00  0.00 0.00 0.00 2169.64 0.00  0.00 0.00 699.93 
12 0.00 12524.50 0.00 0.00 0.00 0.00  0.00 0.00 0.00 

这是我想要的:

 X1  X2  X3  X4  X5  X6  X7  X8  X9 
1  0.00  0.00 ...... 
2  0.00  0.00 ...... 
3 4270.87 455.04 ...... 
4  0.00 12524.50 ...... 
+2

还参见'rowsum' - 'rowsum(数据,appropriate_grouping_vector) ' –

+1

@alexis_laz不错的一个,太简单了! 'rowsum(df1,rep(1:4,each = 3))',考虑张贴为答案。 – zx8754

+0

@alexis_laz - 该死的......我总是忘记'rowsum' - 一个比我的更好的解决方案。 – thelatemail

使用filter基础R溶液(这是stats::filter - 这dplyr bulldozes如果已经加载 - 提防):

data.frame(lapply(df, function(x) filter(x, c(1,1,1), sides=1)[seq(3, nrow(df), 3)])) 
#  X1  X2  X3  X4  X5  X6 X7 X8  X9 
#1 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
#2 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
#3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
#4 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93 

如@alexis_laz以上?rowsum笔记可能是优选的,因为它为它被明确定义目的,形式如下:

rowsum(data, appropriate_grouping_vector) 

所以,像这样的东西:

关于正行个
rowsum(dat, (1:nrow(dat) - 1) %/% 3) 
#  X1  X2  X3  X4  X5  X6 X7 X8  X9 
#0 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
#1 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
#2 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
#3 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93 

下面的代码是一个dplyr溶液从其源(Summing columns on every nth row of a data frame in R)改性。

它通过创建一个索引变量来对行进行分组,然后将这些子集行的rowsums解决。 n可以取任何值,前提条件是nrow(df)可以被n整除。

df <- data.frame(runif(30), runif(30), runif(30)) 
library(plyr); library(dplyr) 

n <- 3 

df %>% 
    group_by(indx = gl(ceiling(nrow(df)/n), n, nrow(df))) %>% 
    summarise_each(funs(sum)) 

拆分数据,然后求和:

# dummy data 
df1 <- mtcars[1:12, 1:6] 

# split sum combine 
t(sapply(split(df1, rep(1:4, each = 3)), colSums)) 

这也将工作:

df$group <- ceiling((1:nrow(df))/3) 
aggregate(. ~ group, data = df, sum)[-1] 

     X1  X2  X3  X4  X5  X6 X7 X8  X9 
1 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
2 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
4 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93