社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

一个回车符搞崩Git，甚至能触发远程代码执行？

AI商业洞察 | 比亚迪与香港科技大学成立具身智能联合实验室；上海19所高校开设AI专业；LGND ...

阿里千问悄悄上线 ChatGPT 平替：Qwen Chat 桌面版，MCP 功能真香！

Nginx 正式拥抱现代 JavaScript！

潘渡招商ETF持仓系列：Galaxy Digital -致力于成为加密货币界的“高盛”

谷歌斥资24亿美元购买Windsurf技术授权，并聘请其CEO；OpenAI CEO：将推迟开放式权...

「4K超分打工仔」4KAgent横扫26项SOTA | 通吃老照片、AIGC图、卫星图、医疗影像等！

机器学习学术速递[7.15]

速递｜OpenAI亲自下场做Agent，ChatGPT能做Excel和PPT，Manus们还卷得动吗...

机器学习学术速递[7.14]

关注

Py学习 » Python

python提供了如何组织类似的组数据

ByHala • 3 年前 • 1287 次点击

我想组织类似的群体数据。这是我的数据框

  SKU
FATUT
GUYGE
FATUT-01
SUPAU
GUYPE
SUPAU-01 
FATUT-02
GUYGE-01

我预期的数据帧如下所示:

     SKU
   FATUT
FATUT-01
FATUT-02
   GUYGE
GUYGE-01
   SUPAU
SUPAU-01
   GUYPE

我想按顺序组织类似的数据组。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/133546

1287 次点击

文章 [ 1 ] | 最新文章 3 年前

Reply

• 1 楼

enke 3 年前

一种选择是使用 groupby 使用参数 sort=False ; 然后连接拆分的数据帧。

工作原理:

组 df 在破折号前按绳子
子句 默认情况下,按groupby键进行排序;当我们指定 sort=False ,我们确保密钥的存储顺序与第一次出现在中的顺序相同 df ,即“GUYPE”留在“SUPAU”后面。
子句 对象包含有关组的信息,可以像字典一样解包。然后解包并构建一个生成器表达式,返回分组的数据帧。
使用 concat ,将拆分的数据帧连接成一个;通过使用 ignore_index=True ,我们忽略来自拆分数据帧的索引,并重置索引。

out = pd.concat((d for _, d in df.groupby(df['SKU'].str.split('-').str[0], sort=False)), ignore_index=True)

输出:

        SKU
0     FATUT
1  FATUT-01
2  FATUT-02
3     GUYGE
4  GUYGE-01
5     SUPAU
6  SUPAU-01
7     GUYPE

但我觉得为了你的任务, sort_values 也可以工作,即使顺序与所需输出中的顺序不完全相同:

df = df.sort_values(by='SKU', ignore_index=True)

输出:

        SKU
0     FATUT
1  FATUT-01
2  FATUT-02
3     GUYGE
4  GUYGE-01
5     GUYPE
6     SUPAU
7  SUPAU-01

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号