社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

机器学习学术速递[12.4]

让我眼前一亮的 6 个 Python 库

凯利公式（Kelly Criterion）仓位管理深度解析与Python实现

30天入门Python（基础篇）——第8天：函数式编程

ChatGPT、Grok、Gemini免费使用次数介绍

【AI】人工智能70年：从图灵测试到ChatGPT的进化史

又一个超实用的Python打包神器！

Python 跨目录导入难题破解：5 种方法 + 实战指南

2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

Python爬虫超详细讲解（零基础入门，老年人都看的懂）

关注

Py学习 » Python

python AsyncHTMLSession:您没有访问此服务器上“XXX”的权限

SamP • 3 年前 • 1289 次点击

我想使用python访问一个网站 AsyncHTMLSession 从…起 requests_html 图书馆
这是我的代码:

from requests_html import AsyncHTMLSession
import asyncio

async def connect_to_site(url):
    session = AsyncHTMLSession()
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"}
    res = await session.get(url, headers=headers)
    print(res)
    await res.html.arender(sleep=5, timeout=30)
    print(res.html.full_text)

url = 'https://www.otcmarkets.com'

asyncio.run(connect_to_site(url))

执行代码后,我得到以下打印:

<回应[200]>
拒绝访问
拒绝访问
你没有权限访问“http://www.otcmarkets.com/“在这个服务器上。
参考#18.9c4519d4。1643149046.338b64e3

可能是什么问题?我怎样才能克服它?

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/130744

文章 [ 1 ] | 最新文章 3 年前

• 1 楼

Alex Kosh 3 年前

我认为这是某种机器人检测。然而 requests_html 可以呈现JS,它不是真正的浏览器,不能完全绕过机器人保护。

你可以使用一些库来控制真正的浏览器,比如 playwright / selenium / puppeteer

下面是一个例子 剧作家 :

from playwright.sync_api import sync_playwright

URL = 'https://www.otcmarkets.com'

with sync_playwright() as p:
    # Webkit is fastest to start and hardest to detect
    browser = p.webkit.launch(headless=True)

    page = browser.new_page()
    page.goto(URL)

    html = page.content()

print(html)

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)