社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

#AI落地项目合集##LLM实战项目大全#GitHub揽获62.-20250825145732

【报告】AIGC专题三：2025字节跳动：深度布局AIGC，竞逐新一轮技术浪潮（附PDF下载）

GPT-5系统提示词被泄露，ChatGPT自己也“承认”了

(from 饼干哥哥) GitHub 上 17 个优秀的 Cla-20250826081440

量化前沿速递：机器学习[20250824]

【精选报告】AIGC专题一：量子位智库：2025中国AIGC应用全景图谱（附PDF下载）

ChatGPT 4.5 国内直接用！

深度学习入门与进阶的核心阅读清单，Ilya Sutskever -20250826065855

#美国16岁男孩自杀父母起诉Chatgpt#美国一名16岁男孩自-20250827170228

2025 最新版：用Python快速上手人工智能与机器学习

关注

Py学习 » Python

Web刮削循环python问题

smk90 • 6 年前 • 1032 次点击

我是一个python的新手,想知道是否有人能够强调一下我在下面的webscraping脚本中出错的地方。

我正试图递归地遍历匹配列表,为每个匹配提取一个累积值(度量)。

我的问题是,每次返回的值完全相同。

我试着添加注释来解释我的每一个观点,任何帮助都表示感谢。

#use Selenium & Beautiful Soup
from selenium import webdriver
import time
from bs4 import BeautifulSoup 

#define URL/driver
my_url = "https://www.bet365.com/#/IP/"

driver = webdriver.Edge()
driver.get(my_url)

#allow a sleep of 10 seconds
time.sleep(10)

#parse the page
pSource= driver.page_source
soup = BeautifulSoup(pSource, "html.parser")


#containers tag - per match
containers = soup.findAll("div", {"class": "ipn-TeamStack "})
for container in containers:
     #Total Match Shots
     cumul_match_shots = 0    
     match = container.find_all('div')
     for data in soup.findAll('div',{'class':'ml1-SoccerStatsBar '}):  
         for result in data.find_all('span'):
             a = result.text
             if len(a) > 0:
                 cumul_match_shots += int(a)
    #print out values
     print(match)
     print(cumul_match_shots)
#close the webpage
driver.close()           `

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/38092

1032 次点击

文章 [ 1 ] | 最新文章 6 年前

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号