使用Python中的pandas模块,您可以非常轻松和有效地操作和分析数据。毫无疑问,这是我拥有的最有价值的工具之一。下面是一些示例代码:
import pandas as pd
file_name = 'file.csv'
df = pd.read_csv(file, low_memory=True)
df = df.loc[df['Source Site'] == 'Amazon', :]
df.dropna(inplace = True, how='all')
df.dropna(inplace= True, subset=['Source Site', 'Date'], how='any')
df.to_csv(file_name, sep=',', encoding='utf-8', index=False)
使用Python中的ftplib模块,您可以连接到FTP服务器并将文件下载到计算机中。我几乎每天都使用这个模块,因为我们从外部接收CSV报告。下面是一些示例代码:
from ftplib import FTP
import os
host = os.environ['HOST']
port = int(os.environ['PORT'])
user = os.environ['USER']
pswd = os.environ['PASS']
ftp = FTP()
ftp.connect(host, port)
ftp.login(user, pswd)
ftp.cwd('/Download/')
file_name = 'file_to_download.csv'
with open(file_name, 'wb') as local_file:
ftp.retrbinary('RETR ' + file_name, local_file.write, 1024)
ftp.quit()
使用Python中的pyodbc模块,您可以轻松地访问ODBC数据库。在我的例子中,我使用它连接到Netsuite并使用SQL查询提取数据。下面是一些示例代码:
import pyodbc
import os
import pandas as pd
user = os.environ['USER']
password = os.environ['PASS']
dsn = list(pyodbc.dataSources().keys())[0]
cnxn = pyodbc.connect('DSN={};UID={};PWD={}'.format(dsn, user, password))
query = "SELECT * FROM ITEMS;"
df = pd.read_sql(query, cnxn)
使用Python中的win32com模块,您可以打开Excel,加载工作簿,刷新所有数据连接,然后保存结果。具体做法如下:
import win32com.client
file = "excel_file.xslx"
xl = win32com.client.DispatchEx("Excel.Application")
wb = xl.workbooks.open(file)
xl.DisplayAlerts = False
xl.Visible = True
wb.RefreshAll()
wb.Close(True)
xl.Quit()
del xl
-End-
最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

在看点这里
好文分享给更多人↓