Py学习  »  Python

python爬虫模拟登录一个asp网站失败

柳知秋 • 7 年前 • 1261 次点击  

登录网址:http://218.6.128.130/web/web/mis/

主要代码:
sess = requests.session()
def login():
    post_url = 'http://218.6.128.130/jiaoshi/bangong/main/check.asp'
        # 密码账号就不写出来了
    postdata = {
        'user': '******',
        'pwd': '',
                'user1':'******',
        'pwd1':'******',

    }
    resp = sess.post(post_url, data=postdata, headers=headers, allow_redirects=True)
    print resp.status_code
    print 'url', resp.url
    print "text", resp.text
    print 'header', resp.headers
    print("history", resp.history)
    sess.cookies.save()
def getAim():
    # 登录成功后想抓取的页面
    url = "http://218.6.128.130/jiaoshi/bangong/main/index1"
    resp = sess.get(url, headers=headers)
    print resp.content.decode('gbk')

执行login函数后,getAim()函数获得的页面内容总是提示“登录超时,请重新登录!“,不知道为什么登录没成功。 希望有大神能指点一二。谢谢

最后一次修改于 (2017-03-09 12:00)
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/1788
 
1261 次点击  
文章 [ 2 ]  |  最新文章 7 年前
柳知秋
Reply   •   1 楼
柳知秋    7 年前

``` header: {'Content-Length': '0', 'X-Powered-By': 'ASP.NET', 'Set-Cookie': 'ASPSESSIONIDSQSCBSRB=CIEALMJAGNFCPNAPCCICMBHI; path=/', 'Server': 'Microsoft-IIS/7.5', 'Cache-Control': 'private', 'Date': 'Fri, 10 Mar 2017 07:05:38 GMT', 'Content-Type': 'text/html'}

cookie: <RequestsCookieJar[<Cookie ASPSESSIONIDSQSCBSRB=CIEALMJAGNFCPNAPCCICMBHI for 218.6.128.130/>]>

确实可能没有登录成功,但表单数据都是我登录成功后,用浏览器的开发者工具找到并复制过来的呀 ``` @Py站长

Py站长
Reply   •   2 楼
Py站长    7 年前

你在Login成功后,把cookie打印出来看看,我怀疑可能没有login成功