私信  •  关注

John Zwinck

John Zwinck 最近创建的主题
John Zwinck 最近回复了
2 年前
回复了 John Zwinck 创建的主题 » 在Python中按间隔计算时间戳实例的数量

首先,你需要清理你的数据。我不知道“0:01”是指午夜后1秒还是一分钟后,熊猫也不知道。适当地写上“0:00:01”或“0:01:00”。然后试试这个:

df = pd.read_table('mydata.txt', header=None)
df.index = pd.to_timedelta(df[0]) # convert from strings
df.resample('1 min').count()

输出为:

           0
0           
00:00:01   5
00:01:01   0
00:02:01   0
00:03:01   0
00:04:01   0
...       ..
02:01:01   0
02:02:01   0
02:03:01   0
02:04:01   0
02:05:01  11

裁判: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.resample.html

你需要 export .bashrc文件中的变量,以便其他程序可以看到它:

export SLACK_URL="https://hooks.slack.com/"

关于什么的更多信息 出口 是的,请看这里: https://askubuntu.com/questions/58814/how-do-i-add-environment-variables

5 年前
回复了 John Zwinck 创建的主题 » 用python实现时间序列数据的智能平均

熊猫很容易相处。首先,构建一个数据帧:

df = pd.DataFrame({'t':t,'y':y})

然后根据时间阈值标记组:

groups = (df.t.diff() > 10).cumsum()

这给了你 [0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2] ,因为 cumsum() 在布尔数组中,只要输入为真,就递增。

最后,使用 groupby() :

df.groupby(groups).mean()

它给你:

         t          y
t                    
0    5.315  17.117000
1  191.129  16.930333
2  368.840  17.675000

如果你在结尾处需要普通的麻木数组,只需加上 .t.values .y.values .

如果您不知道使用什么时间阈值,我相信您可以想出一些启发式的方法,可能涉及到 df.t df.t.diff() .