# Importing libraries import sketch import pandas as pd file = "D://7 Datasciense//DS_visilization//altair//airports.csv" # Reading the data (using twitter data as an example) df = pd.read_csv(file) print(df)
输出美国机场的概况:
# 问表单有哪些项目 df.sketch.ask("Which columns are category type?")
iata, name, city, state, country
合并到下一个命令输出截图
# 描述表单的形状行和列的大小 df.sketch.ask("What is the shape of the dataframe")
The shape of the dataframe is (3376, 8).
以上两条命令的结果:
.sketch.howto
HowTo 是一项功能,它提供了一个代码块,可用作各种数据相关任务的起点或结论。
我们可以要求代码片段来规范化它们的数据、创建新特征、绘制数据,甚至构建模型。
这将节省时间并轻松复制和粘贴代码;
您无需从头开始手动编写代码。
# 请用一段代码实现可视化 df.sketch.howto("Visualize the emotions")
输出
.sketch.apply
.apply 函数有助于生成新特征、解析字段和执行其他数据操作。
要使用此功能,我们需要拥有 OpenAI 帐户并使用 API 密钥来执行任务。我还没有尝试过这个功能。
United Kingdom of Great Britain and Northern Ireland (GB), French Guiana (GF), Guernsey (GG), Greenland (GL), Guadeloupe (GP), Guatemala (GT), Guam (GU),
Croatia (HR), Hungary (HU),
Ireland (IE), Isle of Man (IM), India (IN), Iceland (IS), Italy (IT),
Monaco (MC), Republic of Moldova (MD), Marshall Islands (MH), The former Yugoslav Republic of Macedonia (MK), Northern Mariana Islands (MP), Martinique (MQ), Malta (MT), Mexico (MX), Malaysia (MY),
New Caledonia (NC), Netherlands (NL), Norway (NO), New Zealand (NZ),
Philippines (PH), Pakistan (PK), Poland (PL), Saint Pierre and Miquelon (PM), Puerto Rico (PR), Portugal (PT),
Réunion (RE), Romania (RO), Russian Federation (RU), Sweden (SE), Slovenia (SI), Svalbard and Jan Mayen Islands (SJ), Slovakia (SK), San Marino (SM),
Thailand (TH), Turkey (TR),
Ukraine (UA), United States of America (US), Uruguay (UY),
Holy See (VA), United States Virgin Islands (VI),
Wallis and Futuna Islands (WF), Mayotte (YT),
South Africa (ZA)
安装
pip install pgeocode
例获取特定邮政编码的地理信息
# Checking for country "India"
nomi = pgeocode.Nominatim('In')
# Getting geo information by passing the postcodes
# 追加列表以存储数据 print(f"Extraction of {year} and {city} for {tag} completed")
请注意,我在这里定义了便利设施如餐厅和酒吧。您还可以根据 OSM 标签定义其他类型如休闲。您可以通过咨询谷歌来了解不同的类型。就是这样。总之,它检索指定参数集的 OSM 数据。您可能已经熟悉其中一些库,Sketch、Pendulum、pgeocode 、 ftfy 以及开放街道地图 OSM 数据对于我的数据工程是必不可少的,非常依赖它们。