社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

10年顽疾ChatGPT一眼识破！AlphaGo时刻震撼全球医疗界

专访上海电气品牌公关总监张笛：从“人带人闯市场”到全球品牌，大国重器的出海进化论 | TopDigi...

D20访谈直播预约！阿里AIGC大会“云参与”

Nginx和Apache要成旧爱了？PHP有了新搭档：缝合怪FrankenPHP！

项目从 MySQL 切换 PostgreSQL，踩了太多的坑！！！

【2025版附安装包】超详细Python+Pycharm安装保姆级教程，永久免费使用，Python环...

AIGC独角兽硅基智能完成D轮融资，数字人业务营收数亿、已服务超50万用户｜36氪首发

豆瓣9.5，深度学习入门神作，“鱼书”系列第 5 部生成模型来了！

ChatGPT 4.5 国内直接用！

可灵《新世界加载中》将AIGC短剧带至2.0、奈飞造势Netflix House、科幻短剧机会、腾讯...

关注

Py学习 » Python

Web刮削循环python问题

smk90 • 5 年前 • 981 次点击

我是一个python的新手,想知道是否有人能够强调一下我在下面的webscraping脚本中出错的地方。

我正试图递归地遍历匹配列表,为每个匹配提取一个累积值(度量)。

我的问题是,每次返回的值完全相同。

我试着添加注释来解释我的每一个观点,任何帮助都表示感谢。

#use Selenium & Beautiful Soup
from selenium import webdriver
import time
from bs4 import BeautifulSoup 

#define URL/driver
my_url = "https://www.bet365.com/#/IP/"

driver = webdriver.Edge()
driver.get(my_url)

#allow a sleep of 10 seconds
time.sleep(10)

#parse the page
pSource= driver.page_source
soup = BeautifulSoup(pSource, "html.parser")


#containers tag - per match
containers = soup.findAll("div", {"class": "ipn-TeamStack "})
for container in containers:
     #Total Match Shots
     cumul_match_shots = 0    
     match = container.find_all('div')
     for data in soup.findAll('div',{'class':'ml1-SoccerStatsBar '}):  
         for result in data.find_all('span'):
             a = result.text
             if len(a) > 0:
                 cumul_match_shots += int(a)
    #print out values
     print(match)
     print(cumul_match_shots)
#close the webpage
driver.close()           `

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/38092

981 次点击

文章 [ 1 ] | 最新文章 5 年前

Reply

• 1 楼

opalczynski 6 年前

我认为您需要更改打印(累积匹配放炮)的缩进(并将其稍高一点),就像在当前状态下一样-它将始终为您提供(打印)上一个for循环的值。

我不确定你是否有一个正确的地方,重新设置值为0。目前看来,它将是所有比赛中得分的累积值。

至于match,它应该是OK,因为您不会在for循环中修改它。

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号