Py学习  »  chatgpt

两个人研究ChatGPT,发了一篇Science!

研之成理 • 9 月前 • 99 次点击  
▲第一作者:Shakked Noy
通讯作者:Shakked Noy
通讯单位: 美国麻省理工学院
DOI:
https://www.science.org/doi/10.1126/science.adh2586

01

研究背景


生成式人工智能(AI)的最新进展可能会对生产和劳动力市场产生广泛的影响。生成式人工智能系统,如ChatGPT或Dall-E,可以根据提示从大量训练数据创建新的文本或视觉输出,这在性质上不同于以往大多数自动化技术例子。以前的自动化浪潮主要影响由明确的步骤序列组成的“例行”任务,这些步骤可以很容易地编码并编程到机器或计算机中,例如装配线制造任务。相比之下,写作和图像生成等创造性的、难以编码的任务在以前是很难自动化的。现在深度学习是生成式人工智能系统的基础,学者们指出,随着深度学习的出现,这种模式可能会改变。

02

研究问题


本研究在中级专业写作任务的背景下,考察了生成式人工智能(AI)技术--辅助聊天机器人ChatGPT的生产率效应。在一项预先注册的在线实验中,本研究向453名受过大学教育的专业人士分配了特定职业的激励性写作任务,并随机让其中一半人使用ChatGPT。本研究的结果表明,ChatGPT显著提高了生产率:平均花费的时间减少了40%,产出质量提高了18%。就目前而言,劳动者之间的不平等减少了,而且对人工智能的担忧和兴奋暂时上升。在实验期间接触 ChatGPT 的员工在实验后 2 周报告在实际工作中使用它的可能性是实验后 2 倍,在实验后 2 个月报告使用它的可能性是 1.6 倍。
 
▲图1|生成式人工智能(AI)对生产力的影响

要点:
1.本研究首先展示了两个生产率衡量标准的结果:时间花费和人员等级(图1)。实验干预在很大程度上改变了两种结果。AI辅助的实验组完成任务所需时间较无AI辅助的对照组平均减少11 min(0.75SD),无AI辅助的对照组平均为27 min(P<0.001)。在写作质量、内容质量和独创性方面,AI辅助的实验组评价者的平均评分提高了0.45 SD(P<0.001),总体评分和具体评分也有类似的提高。
2.在本研究的两个主要实验计划中,这些结果几乎是相同的,这两个实验计划覆盖了80%的志愿者:一种是“线性”计划,志愿者在每次提交的文章中获得一分,就会获得1美元的报酬(每种方案的得分都是1到7分);另一种是“凸”方案,即志愿者如果获得6分或7分的分数,就会额外获得3美元的报酬。图1所示的结果是基于这两个实验计划的。接受AI辅助的参与者减少了类似数量的时间,即使面临着产生高质量产出的强烈激励(在凸方案下),这一事实表明,ChatGPT 的省时效果与线性支付制度关联性不高,它与具有非线性激励作用的方案的关联性更高。
 
▲图2|对初始分数分布中的分数和时间的影响

要点:
1.控制组表现出持续的生产率不平等:在第一项任务中得分很高的参与者在第二项任务中也往往得分很高。如图2A所示,在保持评估标准不变的情况下,无AI辅助的参与者在第一个任务上的分数与他们在第二个任务上的分数之间有0.41%的相关性(P<0.001)。
2.在无AI组中,最初的不平等在使用AI辅助之后消除了一半以上:第一任务和第二任务等级之间的相关性仅为0.14(斜率差异P<0.001)。这种不平等的减少是由以下事实推动的:在第一个任务中得分较低的志愿者从ChatGPT中受益更多。如图2a所示,在x轴的左端,使用AI组和不使用AI组之间的差距要大得多。
3.目前尚不清楚这些结论是否应该被解释为ChatGPT将取代人类劳动者的证据。虽然 ChatGPT 直接取代了劳动者的生产,而且几乎不需要人工输入,但它也使劳动者能够更快地完成任务。
 
▲图3|工作满意度、自我效能感和对自动化的信赖。

要点:
1.本研究的许多接受参与者在参与实验之前从未听说过(30%)或从未使用过ChatGPT(68%)。本研究使用了一系列问题来评估他们对遇到这项技术的主观反应。如图3所示,当参与者使用ChatGPT时,0.47 SD的参与者会更热衷于完成任务(P<0.001)。AI辅助组的志愿者对人工智能对职业未来影响的关心(P< 0.001)和兴奋(P<0.05)增加了,总体的乐观情绪也是增加了0.2 SD(P<0.05)。

03

结语


本研究的实验只捕捉到了ChatGPT对员工生产力的直接影响。本研究无法研究随着公司和工人适应ChatGPT而出现的复杂的劳动力市场动态。有几个因素将决定ChatGPT对生产率的直接影响是如何影响受影响职业的工资和就业的。首先是对ChatGPT生产的商品的需求可能扩大的程度,因为ChatGPT推动的生产率提高使这些商品变得便宜得多。例如,如果服务的价格下降,对这些服务的需求可能会大幅增长。因此,总体编程就业可能会增加。目前还不太清楚广告或传播的需求是否会同样扩大,这可能会导致这些行业的就业人数减少,因为满足同样静态需求所需的工人更少。作为一个额外的复杂因素,ChatGPT可能会直接影响需求的构成。例如,在ChatGPT之前有一篇文章表明:一家公司在一条消息上投入了一些人力、思想和判断力会引发消费者的欣赏,然而,随着情况不再是这样,消费者对这些消息的需求可能会减少。第二个因素是,ChatGPT能够很好地补充了人类技能的性质和稀缺性。例如,考虑使用ChatGPT来制作广告内容。最后,ChatGPT的扩散和影响还将取决于组织方面的考虑,而本研究的治疗AI辅助劳动者的实验并没有解决这一问题。大型语言模型可以用来监测或评估工人,从而避免支付更高的工资。围绕使用ChatGPT等工具的可接受性的组织和社会规范可能需要时间来证明,并可能显著影响该技术的采用。
总体而言,ChatGPT的到来开启了一个对人工智能技术的经济和劳动力市场影响存在巨大不确定性的时代。本研究朝着回复许多即将来临的问题迈出了第一步。

原文链接:
https://www.science.org/doi/10.1126/science.adh2586

1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/157685
 
99 次点击