社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

短视频产业市场：AI剪辑师攻占短视频工厂，AIGC如何重构50%创作成本？

机器学习方法 —— KNN、分类回归树、随机森林

2025全球数字经济创新大赛重点推出“AIGC 创作者大赛”

明天见！2025第十三届TopDigital创新营销盛典明日正式开启

2025全球数字经济创新大赛重点推出“AIGC 创作者大赛”

用 Python 打造稳健交易系统：TSI + GAPO 双指标策略实战

资深 Pythoner 所使用的10个高级代码技术

涨分！IF=8.0纯生信！病理组学+深度学习+免疫评分即拿下双一区Top！

【[188星]pyleak：Python异步编程的救星！帮你揪出-20250623223245

任务太难，连ChatGPT都弃了！最强AI神器一键拆解，首测来袭

关注

Py学习 » Python

用python进行网页抓取,javascript输出

user16674073 • 3 年前 • 1264 次点击

我正试图从这个网站上删除工作信息,已经被困了几天。当我打印汤的时候。文本输出我得到一个简短的javascript文本,它不是我想要的,因为我想要html元素。我见过类似的解决方案来实现“无标题浏览”,但当我实现时,我只收到了几个错误。我对网络抓取还不熟悉,看过各种教程和视频,只是没有得到我想要的输出,也不知道我做错了什么。

import requests
from bs4 import BeautifulSoup



def aSwiftScraper():

    jobLinks = []
    pages = []
    URL = "https://www.amiqus.com/jobs?options=,20993,20877,20876&page=1"
    page = requests.get(URL)
    soup = BeautifulSoup(page.content, "html.parser")
    print(soup.text)


aSwiftScraper()

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/130628

1264 次点击

文章 [ 1 ] | 最新文章 3 年前

• 1 楼

Andrej Kesely 3 年前

试着改变 User-Agent 向服务器发出请求时的HTTP头:

import requests
from bs4 import BeautifulSoup

headers = {
    "User-Agent": "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
}

url = "https://www.amiqus.com/jobs?options=,20993,20877,20876&page=1"

soup = BeautifulSoup(requests.get(url, headers=headers).content, "html.parser")
for title in soup.select(".attrax-vacancy-tile__title"):
    print(title.get_text(strip=True))

印刷品:

Engine Programmer C++ AAA opportunity - Remote working
Senior Programmer
Gameplay Programmer

...

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)