社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

python pandas oneHotEncoder类别

Little • 6 年前 • 1631 次点击  

我在读关于Python中一个热编码的文章,有一行我无法解释它的含义。代码如下:

ohe=preprocessing.OneHotEncoder(dtype=np.int,sparse=True,handle_unknown="ignore")
data=ohe.fit_transform(df[["country"]])

当我像这样打印类别值时:

print (ohe.categories_)

它打印 [array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)]

但当我这样做的时候:

print (ohe.categories_[0])

['EEUU', 'France', 'Portugal', 'Italy']

我找不到这个[0]的功能,它似乎从数组转换为列表,但是为什么不使用to list()函数?

我在网上搜索过,但找不到关于这个表达的解释,有什么帮助吗?

谢谢

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/39223
 
1631 次点击  
文章 [ 1 ]  |  最新文章 6 年前
RafaelC
Reply   •   1 楼
RafaelC    6 年前

[array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)] 是包含一个对象的列表。此对象是一个numpy数组。当你这样做的时候 ohe.categories_[0] ,您可以访问此列表中的第一个项目-恰好是列表中的唯一项目。

ohe.categories_ 返回一个列表,因为它返回一个不同的 numpy 输入中每列的数组。自从 df[["country"]] 只有一列,它返回只有一个对象的列表。

如果你这样做了 df[["country", "second_column"]] 例如,您将得到一个包含两个数组的列表,分别说明每个数组的类别。