社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

#老乡鸡菜谱开源了##我在GitHub学做老乡鸡#老乡鸡菜谱在G-20250919105055

GitHub Trending 日报【2025-09-17】

一天Vibe个工具，看真实用户吐槽ChatGPT、豆包、Kimi...

【第3591期】GitHub Spec-Kit：规范驱动开发走在正确的方向上 - 严谨、渐进式的 V...

GitHub高星精选！十大MCP开源项目，让AI开发效率翻倍！

机器学习学术速递[9.17]

从 ChatGPT 到 Marble，李飞飞押注的下一个爆发点是 3D 世界生成？

Nature重磅！超越传统:深度学习赋予基因组学“透视未来”的魔力，改写生命分析规则

如果你开通 ChatGPT Pro 看不到 GPT-4.5 或者-20250917231118

朝鲜黑客组织Kimsuky利用ChatGPT伪造军人证件实施新型攻击

关注

Py学习 » Python

为什么https://nytimes.com工作,但有哪篇文章根本不使用python请求?

jar • 2 年前 • 269 次点击

我正试图从《纽约时报》上获取一些页面的内容。

import requests
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:105.0) Gecko/20100101 Firefox/105.0'}
url='https://www.nytimes.com'
response=requests.get(url,headers=headers)
print(response)

这让我着迷 <Response [200]>

但如果我改变 url 例如,任何特定的文章- https://www.nytimes.com/2022/11/19/sports/soccer/world-cup-qatar-2022.html 然后它给了我 <Response [403]> 。

import requests
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:105.0) Gecko/20100101 Firefox/105.0'}
url='https://www.nytimes.com/2022/11/19/sports/soccer/world-cup-qatar-2022.html'
response=requests.get(url,headers=headers)
print(response)

为什么会发生这种情况?如何让它发挥作用?

我还看了 robots.txt 我看不出任何明显的问题。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/158696

269 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号