社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
私信  •  关注

John Zwinck

John Zwinck 最近创建的主题
John Zwinck 最近回复了
3 年前
回复了 John Zwinck 创建的主题 » 在Python中按间隔计算时间戳实例的数量

首先,你需要清理你的数据。我不知道“0:01”是指午夜后1秒还是一分钟后,熊猫也不知道。适当地写上“0:00:01”或“0:01:00”。然后试试这个:

df = pd.read_table('mydata.txt', header=None)
df.index = pd.to_timedelta(df[0]) # convert from strings
df.resample('1 min').count()

输出为:

           0
0           
00:00:01   5
00:01:01   0
00:02:01   0
00:03:01   0
00:04:01   0
...       ..
02:01:01   0
02:02:01   0
02:03:01   0
02:04:01   0
02:05:01  11

裁判: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.resample.html

你需要 export .bashrc文件中的变量,以便其他程序可以看到它:

export SLACK_URL="https://hooks.slack.com/"

关于什么的更多信息 出口 是的,请看这里: https://askubuntu.com/questions/58814/how-do-i-add-environment-variables

6 年前
回复了 John Zwinck 创建的主题 » 用python实现时间序列数据的智能平均

熊猫很容易相处。首先,构建一个数据帧:

df = pd.DataFrame({'t':t,'y':y})

然后根据时间阈值标记组:

groups = (df.t.diff() > 10).cumsum()

这给了你 [0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2] ,因为 cumsum() 在布尔数组中,只要输入为真,就递增。

最后,使用 groupby() :

df.groupby(groups).mean()

它给你:

         t          y
t                    
0    5.315  17.117000
1  191.129  16.930333
2  368.840  17.675000

如果你在结尾处需要普通的麻木数组,只需加上 .t.values .y.values .

如果您不知道使用什么时间阈值,我相信您可以想出一些启发式的方法,可能涉及到 df.t df.t.diff() .