今天继续昨天没完成的工作。
调试了半天,总算调试完成,运行成功。
这是成功后的代码。
import requests
import re
import pandas
for ii in range(1,10):
header={'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.11; rv:40.0) Gecko/20100101 Firefox/40.0'}
mn=44*(ii-1)
url='https://s.taobao.com/search?q=%E5%B0%8F%E7%B1%B3%E6%89%8B%E6%9C%BA&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306'
html=requests.request('get',url,headers=header)
ren = re.compile('"raw_tiitle":"(.*?)","pic_url":"(.*?)","detail_url":"(.*?)","view_price":"(.*?)"')
data=re.findall(ren,html.text)
data2=pandas.DataFrame(data)
data2.to_csv(r'D:\tbb.csv',header=False,index=False,mode='a+')
虽然是运行成功,可是成功创建的csv里面却没有任何内容。
因为我是改了网址,所以里面的代码肯定是有变化的。
我去看看。
果然,根本没有找到raw_tiitle这个代码。
我重新来看看,它的代码,看看改动一下。
应该不是没有采集到数据,应该是没有写入数据。
我继续吧写入的部分打下来。
import pandas
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rcParams["font.sans-serif"]=['SimHei']
plt.rcParams["axes.labelsize"]=16
plt.rcParams["xtick.labelsize"]=15
plt.rcParams["ytick.labelsize"]=10
plt.rcParams["legend.fontsize"]=10
plt.rcParams["figure.figsize"]=[15,12]
def1=pandas.read_csv('D:\\tbb.csv')
TBdata=pandas.DataFrame(list(def1['I'],def1['F']*def1['C']))
DD= TBdata.groupby([0]).sum()
DD[1].plot(kind='bar',rot=90)
DD[1].plot(rot=90)
plt.show()
代码是这样的。
可是按照惯例,又开始报错了。
直接卡主,头有点大了 。。。
see you