社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

机器学习学术速递[9.3]

NeurIPS 2025近3万投稿爆仓！深度学习论文如何突围

今日起AIGC不标识就挨罚

China Launches National Digital ID to Secure Onlin...

ChatGPT 4o 国内直接用！

ChatGPT 4.5 国内直接用！

有人让 ChatGPT 管理股票投资组合。超过 2 个月，Cha-20250903110700

专利巨头的无形资产帝国：解析 InterDigital（IDCC）的商业模式

Python 3.14

ChatGPT突发全球性宕机事故，或由前端系统异常导致；抖音安全中心公告:严厉打击AI滥用等欺诈行为...

关注

Py学习 » Python

用python实现时间序列数据的智能平均

npross • 6 年前 • 484 次点击

我有以下(时间序列)数据:

t = [5.13,   5.27,   5.40,   5.46,  190.99, 191.13, 191.267, 368.70, 368.83,  368.90, 368.93]
y = [17.17, 17.18, 17.014, 17.104,  16.981,  16.96,   16.85,  17.27, 17.66,   17.76, 18.01]

因此,以短(时间)间隔排列的数据组,然后以长时间间隔清晰地分开。

我正在寻找一种简单的方法,它可以智能地将这些数据平均起来;有点像“贝叶斯块”,但用于非柱状图数据。

一个人可以做一个简单的移动平均,或是无意义的卷积,但我正在寻找一个更聪明的方法,可以推广到更大、相似但不完全相同的数据集。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/38155

484 次点击

文章 [ 1 ] | 最新文章 6 年前

• 1 楼

John Zwinck 6 年前

熊猫很容易相处。首先,构建一个数据帧:

df = pd.DataFrame({'t':t,'y':y})

然后根据时间阈值标记组:

groups = (df.t.diff() > 10).cumsum()

这给了你 [0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2] ,因为 cumsum() 在布尔数组中,只要输入为真,就递增。

最后,使用 groupby() :

df.groupby(groups).mean()

它给你:

         t          y
t                    
0    5.315  17.117000
1  191.129  16.930333
2  368.840  17.675000

如果你在结尾处需要普通的麻木数组,只需加上 .t.values 和 .y.values .

如果您不知道使用什么时间阈值,我相信您可以想出一些启发式的方法,可能涉及到 df.t 和 df.t.diff() .

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)