wpercy的回复列表

社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

罗氏半年报：终止开发TIGIT抗体、PD-1/IL-2

机器学习学术速递[7.24]

机器学习学术速递[7.25]

罗氏正式放弃TIGIT疗法

警惕！“海莲花”APT组织利用Python官方软件仓库PyPI发起定向“投毒”攻击

可灵AI多图参考生视频模型升级：效果“提升102%”；小鹏机器人新成立智能拟态部，主攻机器人多模态丨...

20个非常有用的Python单行代码

【2025版附安装包】超详细Python+Pycharm安装保姆级教程，永久免费使用，Python环...

机器学习学术速递[7.28]

TIGIT公司卖了

6 年前

回复了 wpercy 创建的主题 » 如何根据python中JSON文件的最新时间戳条件创建和写入文件?

要对熊猫执行此操作,您可以使用数据创建一个数据帧,添加一个名为 fullPath 按那个分组,然后过滤到最大值 jobEndTimestamp 。像这样:

import pandas as pd

with open('/Users/mona/stream.json', 'r') as f:
    item_dict = json.load(f.read())

df = pd.DataFrame(item_dict['sources'])
df['fullPath'] = df['yamlPath'] + df['yamlName']
grouped = df.groupby('fullPath').apply(lambda d: d[d['jobEndTimestamp'] == d['jobEndTimestamp'].max()])

print grouped['sqlQuery']

会屈服的

fullPath
/app/computer/a/users/boat-notice-data.yaml  3    select from table.b
/app/computer/s/users/car-notice-data.yaml   2    select from table.b
/app/computer/users/ship-notice-data.yml     1    select from table.b
Name: sqlQuery, dtype: object

6 年前

回复了 wpercy 创建的主题 » 没有in的python列表理解

所以这里的语法有点混乱,但是实际发生的是 c.items() 是包含单词及其计数的元组。

更明确的写作方式是:

vocab = [x for (x, count) in c.items() if x>=2]

但也可以这样做:

vocab = [x[0] for x in c.items() if x[1]>=2]

哪里 x 是元组。

也有助于了解 c 实际上看起来像。如果打印c,您会看到:

>>> print c
Counter({'lie': 3, 'is': 2, 'and': 1, 'a': 1, 'There': 1, 'only': 1, 'passion': 1, 'piece': 1})

和 C项()

>>> print c.items()
[('and', 1), ('a', 1), ('lie', 3), ('is', 2), ('There', 1), ('only', 1), ('passion', 1), ('piece', 1)]

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)