社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

D20访谈直播预约！阿里AIGC大会“云参与”

豆瓣9.5，深度学习入门神作，“鱼书”系列第 5 部生成模型来了！

ChatGPT 4.5 国内直接用！

13个Python小游戏，今天上班摸鱼玩了一天

8 个 Python 库，再也不需要自己编写脚本了

ChatGPT们重塑了对话框，钉钉今天要重塑表格

Gitee Pipe：关键领域DevSecOps的核心引擎

CCF Computility 2025 | 郭得科、徐扬、王兴伟、过敏意、任丰原等教授邀您共话分布...

AI商业洞察 | 比亚迪与香港科技大学成立具身智能联合实验室；上海19所高校开设AI专业；LGND ...

这篇Reddit帖子很火🔥——ChatGPT 解决了医生十多年-20250709214725

关注

Py学习 » 机器学习算法

在spark中创建n个机器学习模型,并行化[复制]

Ryan • 5 年前 • 758 次点击

所以我已经尝试了几天在Spark的map函数中运行ML算法我发布了一个更具体的 question 但是引用Spark的ML算法会产生以下错误:

AttributeError: Cannot load _jvm from SparkContext. Is SparkContext initialized?

显然我不能引用 SparkContext 在里面 apply_classifier 功能。我的代码与上一个问题中的建议类似,但仍然没有找到解决我所寻找的问题的方法:

def apply_classifier(clf):
    dt = DecisionTreeClassifier(labelCol="indexedLabel", featuresCol="indexedFeatures", maxDepth=3)
    if clf == 0:
        clf = DecisionTreeClassifier(labelCol="indexedLabel", featuresCol="indexedFeatures", maxDepth=3)
    elif clf == 1:
        clf = RandomForestClassifier(labelCol="indexedLabel", featuresCol="indexedFeatures", numTrees=5)

classifiers = [0, 1]

sc.parallelize(classifiers).map(lambda x: apply_classifier(x)).collect()

我试过用 flatMap 而不是 map 但我知道 NoneType object is not iterable .

我还想在 应用分类器 功能。最后,有可能做我想做的事吗?有哪些选择?

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/48378

758 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号