社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

【深度学习】目标检测的常用数据处理方法！

【Nucleic Acids Research】利用生成式深度学习模型设计蓝藻细菌的合成启动子

本周推荐的6个火火火的Github开源项目！

GitHub(微博搜索)-20240416-1

融合ChatGPT+DALL·E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

【生物催化】一种实用的机器学习辅助蛋白质工程研究范式

【东方金工·上海线下沙龙】深度学习与量化投资

GitHub(微博搜索)-20240414-1

ChatGPT Plus等用户，可使用最新GPT-4 Turbo模型

【一个机器学习知识库，涵盖了从基础到高级主题的机器学习知识，包括-20240413124243

私信 • 关注

Srivats Shankar

Srivats Shankar 最近创建的主题

» Srivats Shankar 创建的更多主题

Srivats Shankar 最近回复了

4 年前

回复了 Srivats Shankar 创建的主题 » AttributeError:“NoneType”对象没有属性“text”。用Python进行Web抓取[duplicate]

答案相对简单。您需要查看您试图擦掉的HTML的源代码。

不是所有的 div 实体有你要找的薪水信息。因此,您运行的一些搜索返回了Python所指的 None 价值实体。不能打印,尽管你可以操纵它。

您需要做的就是检查薪资信息的值是否是可打印的值。

    salary = i.find('span', attrs={"class":"salaryText"})
    if salary is not None:
      print('salary:', salary.text)

整个代码如下:

import urllib.request as urllib
from bs4 import BeautifulSoup
import csv

# empty array for results
results = []

# initialize the Indeed URL to url string
url = 'https://www.indeed.com/jobs?q=software+developer&l=Phoenix,+AZ&jt=fulltime&explvl=entry_level'
soup = BeautifulSoup(urllib.urlopen(url).read(), 'html.parser')
results = soup.find_all('div', attrs={'class': 'jobsearch-SerpJobCard'})

for i in results:
    title = i.find('div', attrs={"class":"title"})
    print('\ntitle:', title.text.strip())

    salary = i.find('span', attrs={"class":"salaryText"})
    if salary is not None:
      print('salary:', salary.text)

    company = i.find('span', attrs={"class":"company"})
    print('company:', company.text.strip())

» Srivats Shankar 创建的更多回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号