Py学习  »  Python

利用Python来抓取炉石所有卡牌!然后生成女神小姐姐图片!吊不吊

Python学习交流 • 5 年前 • 669 次点击  


炉石传说原画2

本打算使用Selenium模拟点击获取图片信息

尝试发现源码中 该按钮并无相应的跳转链接

进群:548377875   即可获取数十套PDF哦!


这不应该啊 没有相应的跳转链接 点击后是如何加载新的图片?

后来浏览整体网站源码后 发现把问题想复杂 根本不需要模拟点击查看更多


网站其实已经加载了所有的卡牌原画 只是之后的原画做了隐藏处理默认不展示 style=display

点击查看更多后 显示原画

那么只需使用requests获取网页源码

用BeautiSoup/正则表达式/pyQuery解析元素 遍历相应img的url 即可下载

Github


炉石传说卡牌链接


炉石传说卡牌

该网站通过下拉右边的滚动条不断加载新的卡牌

与上一个网站不同 上一个网站一次性写入了所有卡牌 只不过做了隐藏处理

该网站是通过js动态加载渲染出的卡牌 直接获取源码 无法得到所有卡牌信息

那么就用selenium模拟下拉滚动条(selenium简直居家必备之神器)


第一次没有设置停留时间 无法获取新的数据 怀疑自己 怀疑人生

经前端/后端好友L君的提示 需增加暂停时间 这样才能获得加载渲染后的数据

browser.page_source便可获得动态加载的所有数据

有了数据 之后就很简单 正则匹配获取相应url下载即可




谢谢你!

顺手拼一下女神



漂亮吧,漂亮就对了!



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/fqalXB7Yaf
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/22840
 
669 次点击