社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python学习日记 16

舍山 • 5 年前 • 301 次点击  

今天来更新的就比较早了。
因为比较有精神了,发烧也好的差不多了。

so,进入正题。
因为之前格式化了硬盘,所以所有的东西都要重新装一遍。

这里放一个不同办法的解释在这里。

Download Windows x86-64 web-based installer--在线安装
Download Windows x86-64 executable installer--exe程序安装
Download Windows x86-64 embeddable zip file--压缩文件解压缩安装

ok,这次我装的是3.7的版本。

变量设置

和mac不一样的是,windows首先要设置变量,把路径先设置好。

第一次运行

话说windows还是很视觉化的,可以随便放置py文件,只要把路径设置对就可以了。

然后安装PyCharm 。


安装运行完成

然后,首先把之前写的爬虫代码运行一下,先装bs4这库,都要比mac os方便很多。

完美运行

知其然不知其所以然,所以我得一句一句的研究。
先从BeautifulSoup开始。

from bs4 import BeautifulSoup
from lxml import html
import xml
import requests

url = "https://movie.douban.com/chart"
f = requests.get(url)                 #Get该网页从而获取该html内容
#通过requests这个请求把网址里面的源代码拿到

soup = BeautifulSoup(f.content, "lxml")  #用lxml解析器解析该网页的内容, 好像f.text也是返回的html
#print(f.content.decode())
#content = soup.find_all('div',class_="p12" )   #因为calss和关键字冲突,所以改名class_

for k in soup.find_all('div',class_='pl2'):#,找到div并且class为pl2的标签
  #把里面的内容赋予到k这里。

   a = k.find_all('span')       #在每个对应div标签下找span标签,会发现,一个a里面有四组span
   print(a[0].string)            #取第一组的span中的字符串
#string 字符串的意思

我加了一些注释。
勉强解释了一下,明天可以自己写一个来看看。

see you


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/Dt2OSAWBpg
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/24895
 
301 次点击