RafaelC的社区主页

RafaelC 最近回复了

5 年前

回复了 RafaelC 创建的主题 » 在python中,如何将列从unnamed:0重命名为带递增数的列

你的数据已经在增加。你只是想 t 而不是 unnamed: 作为前缀。

df.columns = df.columns.str.replace('unnamed:', 't')

6 年前

回复了 RafaelC 创建的主题 » python:从对象列表中删除几乎重复的内容

使用 pandas

df = pd.DataFrame(l)
df.loc[df[1].drop_duplicates().index].values.tolist()

6 年前

回复了 RafaelC 创建的主题 » python pandas oneHotEncoder类别

[array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)] 是包含一个对象的列表。此对象是一个numpy数组。当你这样做的时候 ohe.categories_[0] ,您可以访问此列表中的第一个项目-恰好是列表中的唯一项目。

ohe.categories_ 返回一个列表,因为它返回一个不同的 numpy 输入中每列的数组。自从 df[["country"]] 只有一列,它返回只有一个对象的列表。

如果你这样做了 df[["country", "second_column"]] 例如,您将得到一个包含两个数组的列表,分别说明每个数组的类别。

6 年前

回复了 RafaelC 创建的主题 » python:如何通过切片来选择某些列,以替换groupby后面的NaN值?

我不确定我是否理解你的问题。

据我所见,你可以直截了当

df.groupby('Col1').ffill().bfill()

因为 ffill() 和 bfill() 只是不更改列 NaN S.

现在,如果您事先知道需要回填/ffill哪些列并希望减少冗长性,可以将它们保存在 cols 变量

cols = ['Col3','Col4','Col5']
df[cols] = df.groupby('Col1')[cols].ffill().bfill()

» RafaelC 创建的更多回复