社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
罗氏半年报:终止开发TIGIT抗体、PD-1/IL-2
机器学习学术速递[7.24]
机器学习学术速递[7.25]
罗氏正式放弃TIGIT疗法
警惕!“海莲花”APT组织利用Python官方软件仓库PyPI发起定向“投毒”攻击
可灵AI多图参考生视频模型升级:效果“提升102%”;小鹏机器人新成立智能拟态部,主攻机器人多模态丨...
【2025版附安装包】超详细Python+Pycharm安装保姆级教程,永久免费使用,Python环...
20个非常有用的Python单行代码
机器学习学术速递[7.28]
TIGIT公司卖了
关注
Py学习
»
chatgpt
ChatGPT正在逐步取代数据科学家?
MarTechCareer
• 1 年前 • 209 次点击
▲
点击[
MarTechCareer
] → 点击右上角[...] → 点击[设为星标
★
]
第一时间获得最前沿的数据、营销、产品等内容
当
你正在阅读这篇文章的时候,也许你已经在数据行业有一份工作,或者正打算进入这个领域。随着过去一年生成式人工智能领域所取得的种种进展,你可能会担心数据科学岗位是否会被
AI
取代。
一年前如果有人提出想要用
AI
自动化我的数据科学工作,我会嗤之以鼻。我甚至写过一整篇文章,里面论述了
AI
不可能取代数据科学家——因为我们不仅仅是编写代码,构建机器学习模型,分析数据,我们还需要将复杂的信息解释给非技术人员。我们的工作很有挑战性,这些技能需要多年的磨炼。
AI
可以提高效率和数据团队之间的协作,但它绝对无法取代我们正在做的实际工作。
然而,上述博文是在
ChatGPT
发布之前写的。此后,我目睹了生成式人工智能领域发生的具有重大影响的进展。所以,在本文中,我将重新评估我对数据科学未来的立场,基于生成式人工智能领域的现有发展。根据我的广泛研究和行业专家的见解,我将提出一系列观点,解释为什么
ChatGPT
可能会取代数据科学家,以及它可能不会的原因。我将探讨辩论的双方留给你,读者,来做出明智的决策:决定生成式人工智能是否会使数据科学家变得不再必要。
不利因素:数据科学岗位面临风险的原因:
1. ChatGPT
可以快速编写代码
数据科学家花费大约
40%-50%
的时间编写代码。
不仅如此,
ChatGPT
在编写代码方面表现出色,而且速度飞快。这款聊天机器人已经通过了多家顶级公司的编码面试,可以将手绘草图转化为完整的网站,还可以在几秒钟内从用户故事中构建数据库表。实际上,这位软件公司的首席执行官表示,该模型将完成编码任务所需的时间从
9
周减少到了几天左右这把效率提高了
20
倍以上,这将显著减少公司需要雇佣的编程人员数量。
2. ChatGPT 可以提取和分析数据
现在,你可能会想:“编程只是数据科学家工作的一小部分。我们的工作涉及机器学习建模、统计分析以及向利益相关者提供见解。”那么,
ChatGPT
也可以胜任这些任务。
该模型的新的
Code Interpreter
插件(现在叫“高级数据分析”)允许你在
ChatGPT
界面内上传和分析数据。
该模型也能够预处理数据集,用
K-Means
聚类找到最佳簇数,构建算法,甚至根据模型的输出提供基于数据的见解。
根据《商业内幕》(
Business Insider
)的报道,与编程和分析相关的工作是最有可能被人工智能自动化的工作之一。布鲁金斯学会的高级研究员马克·穆罗(
Mark Muro
)研究了人工智能对美国劳动力的影响,他声称这是因为
ChatGPT
可以比人类更快地生成代码,而且擅长分析数据和预测结果。
3. 架起人类和技术之间的桥梁
许多我合作过的非技术人员很难阅读
Excel
表格中呈现的数据。这些人很忙,他们需要我用最直白的语言去解释分析结果。例如,市场团队会提出类似“哪些客户最有可能再次购买产品
X
”这种问题,并期望你用几张
ppt
回答,然后再强调驱动重复购买的预测性指标。作为一种语言模型,像这样的用例正好适合
ChatGPT
。
ChatGPT
不会为你提供复杂的图表和计算,而是会告诉你关于客户数据集的一切,为你提供了进行基于数据的市场决策所需的知识。
ChatGPT
的对话能力,结合其技术能力,可以使数据科学和分析等领域大众化。曾经需要你具备对
Excel
或
Python
的深刻理解才能完成的任务,现在可以轻松地通过像
“高级数据分析”插件这样的工具完成。
此外,
ChatGPT Enterprise
刚刚发布,允许公司为其员工购买语言模型的订阅。
OpenAI
称这是
ChatGPT
的“最强大版本”,因为它没有使用上限,性能提高了一倍。它还提供对“高级数据分析”插件的无限访问。由于这个版本的
ChatGPT
符合
SOC2
标准,员工可以直接将专有的公司数据集上传到
ChatGPT
接口上,而不必担心泄露敏感的公司信息。
前面的那部分可能会让人感到有点沮丧,我几乎能看到有些人正在摇头表示不同意我提出的观点。但不要担心!我们现在将探讨为什么许多人认为数据科学工作是安全的(至少目前是这样的):
1. ChatGPT无法进行复杂的数据分析
数据科学家(和分析师)通常会从多个来源收集数据。
这项工作并不像使用“高级数据分析”插件将单个数据集上传到
ChatGPT
那样简单。例如,我目前正在进行一个需要分析成千上万个
PDF
文件的项目。这项任务因为规模而具有挑战性,需要处理大量数据,而每个
PDF
文档包含不同类型的信息,如表格和图像。对于这项任务,
ChatGPT
就没有太大帮助。
当然,它能够帮助我编写提取和分析数据所需的代码。
但是一个没有编程知识的人无法运行、验证或调试代码。
此外,大多数公司将它们的信息存储在
SQL
数据库中。“
高级数据分析”插件只限于文件上传,这意味着它无法直接与公司内部数据库进行交互。
因此,公司仍然需要具备数据库管理和
SQL
查询等必要技能的人员来访问、解释和分析来自这些数据库的数据。
2. ChatGPT无法模仿人类进行决策
根据畅销书作者和领先的业务和数据专家伯纳德·马尔(
Bernard Marr
)的说法,
即使是最复杂的人工智能模型
也缺乏批判性思维、战略规划和解决问题等能力。
这些模型不了解业务的内部运作,也缺乏领域专业知识。如果您问它“为什么产品销售在过去
2
个月内大幅下降”,该模型将缺乏有关您的组织所需的上下文信息,无法提供明智的回应。此外,人类分析师或数据科学家通常会与组织内的不同团队进行交流并了解业务问题,从而提出解决方案。
3. ChatGPT容易犯错
ChatGPT
在编写代码、解释数据和生成见解时可能会出现错误。根据由
AI
模型生成的数字做出业务决策几乎是不可能的,没有公司愿意去冒这个风险。人类专家仍然需要验证
AI
模型生成的代码和输出。事实上,我与许多组织合作,这些组织目前在做出决策之前有两种生成预测的方式——内部的数据科学团队和外部的咨询公司。这两个实体生成的数字会进行比较,通常会进行调和,以确保预测保持一致。如果公司愿意花费数万美元雇佣第三方咨询公司,仅仅是为了在决定如何继续之前验证他们的预测,你真的认为他们会为了降低成本而用
AI
模型替换他们的数据科学家吗?
在我看来,以
AI
生成的预测将作为基线可能会成为公司验证其数据科学团队提供的见解的另一种方式。
我从事数据科学工作,如何确保自己的饭碗不受AI冲击?
首先,你必须拥抱
/
接受人工智能。利用它来紧跟行业趋势并学习新知识。根据《
Forbes
》的一篇文章,如果你认为
AI
不会极大地改变你的工作方式只会让你适得其反。多使用生成式
AI
模型来自动化你工作的一部分,并利用效率提升来培养能让你在这一领域脱颖而出的额外技能。
另外,前
Meta
数据科学家
Tina Huang
建议你建立多个收入来源,而不仅仅依赖全职工作。你可以开始提供自由职业的数据科学服务,以获取其他收入,确保你的职业安全不仅仅依赖于单一雇主的决策。
最后,我个人认为,组织在招聘员工时青睐的品质将发生变化。传统上,工作要求极大强调技术技能——你在
Excel
、编程或
Tableau
方面越擅长,就越有可能被雇佣。但是之后重点将逐渐从工具和技术专长转向其他方面,因为生成式
AI
模型正在填补这一领域的技能差距。
相反,组织将开始青睐沟通、创造力、领导力和决策等技能。
一个理解如何利用
AI
来实现公司目标的人,对雇主来说将远比那些只提供技术专长的人更有价值。
毋庸置疑,人工智能是现今的热门话题,
而在人工智能中,自然语言处理占据了重要地位。如果你想踏入数据科学领域,就应该准备好掌握你在大学课程中错过的新技能,积极学习自然语言处理等技术,成为一名成功的数据科学家,以满足当前AI行业的最新需求。那么除了大学,还在哪里能学习这些必备技能呢?
如果你想系统地学习自然语言处理,
了解这项AI技术的更多应用,那千万别错过的MarTechApe携手谷歌美国软件工程师、东南亚独角兽公司Grab的资深数据科学家共同打造的
《Python自然语言处理课程》
,教你从0到1地学会应用超级广泛的NLP技术!
PYTHON
自然语言处理
课程介绍
1. 来自Google和Grab的课程主讲老师
2. 理论与实践相结合的课程安排
这门课共分6章节,每章节都由
理论课程
与
编程实践
两部分组成。确保每一位学员可以学以致用、真正理解课堂内容。在完成课程后,学员不仅对自然语言处理有了一定的掌握,同时也熟练运用
Python
编程语言。
完整的课程大纲
3. 课程适合人群与学员收获
适合人群
想要系统性学习自然语言处理,了解如何应用NLP解决文本分析问题的人
想学习如何用Python做数据科学项目的人
想在数据科学、人工智能等领域,找到职业方向的人
想进入高科技公司的人
虽然从没有过数据科学经验,但是想要用数据科学前沿技术来提升自己工作能力与求职竞争力的人(尤其是,当你的工作需要经常与用户调研、定性研究、文本分析打交道时,NLP可以大大提高你的工作效率!)
在工作/学习中需要与自然语言处理打交道的人(尤其推荐工作中负责AI产品的人来报名课程)
希望从其他行业领域转型到数据科学的人
你将获得
来自Google美国与Grab新加坡的资深数据科学家的一手经验输出
丰富的行业洞察与NLP的实际案例
学习理论的同时,熟练掌握Python并完成NLP文本分析
完成一份自己的NLP语义分析与主题模型
洞悉面试中的NLP真实考题,助力数据科学的求职进程
4. 价格
课程价格:¥399人民币
微信购买通道
还等什么,快来一起走进自然语言处理的世界吧!
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/163098
209 次点击
登录后回复