社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

机器学习学术速递[3.16]

机器学习学术速递[3.18]

机器学习学术速递[3.17]

【2026年爆火】Kimi提出注意力残差AttnRes，即插即用，18行代码，开启深度学习新范式！

这些国家，有自己的「ChatGPT」

Cell 报道：华人学者团队提出一种基于深度学习的设计治疗方法 — GPS，以逆转疾病相关转录表型，...

PNAS：机器学习解读黄铁矿揭示地球氧气变化规律

【报告】AI专题一：AIGC报告5.0-生成式人工智能行业深度研究报告(2026年版)（附PDF下载...

复旦大学郑耿锋团队ACS Catal.: 机器学习指导电还原C-N偶联选择性生成甲酰胺

iMetaMed | 李文乐/栾昊鹏/刘强-基于机器学习的后路脊柱矫形手术难度预测及风险分层：多中心...

关注

Py学习 » Python

用python进行网页抓取,javascript输出

user16674073 • 3 年前 • 1470 次点击

我正试图从这个网站上删除工作信息,已经被困了几天。当我打印汤的时候。文本输出我得到一个简短的javascript文本,它不是我想要的,因为我想要html元素。我见过类似的解决方案来实现“无标题浏览”,但当我实现时,我只收到了几个错误。我对网络抓取还不熟悉,看过各种教程和视频,只是没有得到我想要的输出,也不知道我做错了什么。

import requests
from bs4 import BeautifulSoup



def aSwiftScraper():

    jobLinks = []
    pages = []
    URL = "https://www.amiqus.com/jobs?options=,20993,20877,20876&page=1"
    page = requests.get(URL)
    soup = BeautifulSoup(page.content, "html.parser")
    print(soup.text)


aSwiftScraper()

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/130628

文章 [ 1 ] | 最新文章 3 年前

• 1 楼

Andrej Kesely 4 年前

试着改变 User-Agent 向服务器发出请求时的HTTP头:

import requests
from bs4 import BeautifulSoup

headers = {
    "User-Agent": "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
}

url = "https://www.amiqus.com/jobs?options=,20993,20877,20876&page=1"

soup = BeautifulSoup(requests.get(url, headers=headers).content, "html.parser")
for title in soup.select(".attrax-vacancy-tile__title"):
    print(title.get_text(strip=True))

印刷品:

Engine Programmer C++ AAA opportunity - Remote working
Senior Programmer
Gameplay Programmer

...

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)