如何避免在Python中嵌套'for循环'？

问题描述：

我有表格的数据框（df）：如何避免在Python中嵌套'for循环'？

 SERV_OR_IOR_ID IMP_START_TIME IMP_CLR_TIME  TIME_BIN 
0   -1447310116 23:59:32.873000 00:11:28.755000 
1   1673545041 00:00:09.182000 00:01:06.912000 
2   -743717696 23:59:57.312000 00:00:32.428000 
3   -746373244 23:59:57.915000 00:05:33.232000

我将每天的24小时到30分钟的时间仓“，所以零时间仓是从00：00-00： 30，首先从00：30-01：00等等。在此之后，我想为每行分配'TIME_BIN'列中的值，具体取决于'IMP_START_TIME'落在哪个时间窗口。例如：对于行'1'，我将分配值'0'，因为它落在时间窗口'00:00'-00:30中。

对于这一点，我写了下面的代码：

interval = dt.timedelta(minutes=30) 
start = dt.time(0,0,0) 

grid =[(dt.datetime.combine(dt.date(1,1,1),start)+n*interval).time() for n in range(48)] 


for j in range(len(df)):   
    for i in range(0,47): 
     if df.ix[j,1] <grid[i+1] and df.ix[j,1] > grid[i]: 
      df.ix[j,3] = i 

     elif df.ix[j,1] > grid[47]: 
      df.ix[j,3] = 47

此代码需要花费大量的时间来嵌套for循环的运行因。有没有更有效的方法来做同样的事情？

使用[拉链]（https://docs.python.org/2/library/functions.html#zip），以尽量减少缩进层次 –

你就不能加起来分钟和数据帧中每行的小时数，然后除以30？ 1:23 - > 83 - > 83/30 - > 2 –

@DanielFrühauf - 谢谢！这工作:) – Shreyas

答

这应该是更快：

index = pd.date_range('1/1/2000', periods=48, freq='30T').time 
index = {v: i for i, v in enumerate(index)} 
df['TIME_BIN'] = pd.to_datetime(df['IMP_CLR_TIME']).dt.floor('30T').dt.time.map(index)

答

可以计算的，而不是查找所需斌。它应节省很多：

def halfhour_bin(time): 
    return ((time.hour*60)+time.minute)//30 

for j in range(len(df)):   
    df.ix[j,3] = halfhour_bin(df.ix[j,1])

如何避免在Python中嵌套'for循环'？

相关推荐