Py学习  »  Python

python slapy响应站

吴洲洋 • 6 年前 • 1455 次点击  
def all_type(self, response):
    if response.url is 'http://www.ccdy.cn/zhuanti/' and response.url is 'http://www.ccdy.cn/difang/':
        if response.status != 404:
            yield scrapy.Request(url=response.url, callback=self.all_article)
            for i in range(0, 24):
                type_url = response.url + 'index_' + str(i) + '.htm'
                yield scrapy.Request(url=type_url, callback=self.all_type)

为什么我禁用了404的状态代码,不再访问它,但爬虫仍然访问404页?这是一个爬虫人写的 scrapy . 主要问题是 response.status != 404 不起作用。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/31115
 
1455 次点击  
文章 [ 1 ]  |  最新文章 6 年前