社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
私信  •  关注

RafaelC

RafaelC 最近创建的主题
RafaelC 最近回复了
5 年前
回复了 RafaelC 创建的主题 » 在python中,如何将列从unnamed:0重命名为带递增数的列

你的数据已经在增加。你只是想 t 而不是 unnamed: 作为前缀。

df.columns = df.columns.str.replace('unnamed:', 't')
6 年前
回复了 RafaelC 创建的主题 » python:从对象列表中删除几乎重复的内容

使用 pandas

df = pd.DataFrame(l)
df.loc[df[1].drop_duplicates().index].values.tolist()
6 年前
回复了 RafaelC 创建的主题 » python pandas oneHotEncoder类别

[array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)] 是包含一个对象的列表。此对象是一个numpy数组。当你这样做的时候 ohe.categories_[0] ,您可以访问此列表中的第一个项目-恰好是列表中的唯一项目。

ohe.categories_ 返回一个列表,因为它返回一个不同的 numpy 输入中每列的数组。自从 df[["country"]] 只有一列,它返回只有一个对象的列表。

如果你这样做了 df[["country", "second_column"]] 例如,您将得到一个包含两个数组的列表,分别说明每个数组的类别。

我不确定我是否理解你的问题。

据我所见,你可以直截了当

df.groupby('Col1').ffill().bfill()

因为 ffill() bfill() 只是不更改列 NaN S.

现在,如果您事先知道需要回填/ffill哪些列并希望减少冗长性,可以将它们保存在 cols 变量

cols = ['Col3','Col4','Col5']
df[cols] = df.groupby('Col1')[cols].ffill().bfill()