社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

你的表情包出卖了你!6000万条GitHub帖子告诉你:工作状态与表情符号强相关

CDA数据分析师 • 4 年前 • 516 次点击  

作者 | 凌霄
出品 | AI科技大本营(ID:rgznai100)

随着远程办公人数大幅度增加,然而,当越来越多的人远程工作时,人们的情绪和心理健康状态也难以通过日常面对面的交流来观察,雇主们也就无法获得员工的工作满意度和心理健康状态。
众所周知,工作中的个人的情绪状态是反映工作动机,态度的关键信号,也与你的工作绩效紧密相关,例如,饱满的激情可以增加创造力,过度的激情则会导致倦怠,进而导致低生产力,甚至于中止工作。在线下的工作场合中,我们可以从面对面的交流中观察彼此的情绪状态。

01

文本表情反映工作状态
GitHub最近的一份报告指出,开发人员在疫情期间的工作时间更长,不免引发了对开发人员的工作态度是否倦怠产生了担忧。因此,如何追踪远程办公人员的情绪状态和心理健康是研究工作中的一大挑战。
远程办公时,许多的在线平台被利用起来进行沟通和协作,虽然有一部分工作中的交流是实时和面对面的(如视频会议),但更多的是通过文本进行传达(如电子邮件、即时消息、论坛讨论)。人们也同样会在这些文本中表达情感,来自密歇根大学、马里兰大学和北京大学的研究人员通过监控文本表情的表达来跟踪人们的精神状态。研究人员发现了在线交流中文本表情与员工的工作状态高度相关,为监控员工的情绪状态提供了一种新的方法,可以帮助公司预测远程办公员工的工作行为模式,甚至于评估员工的离职风险。
在线文本表情能真实反映远程办公人员的工作状态吗?
这个问题其实并不容易回答,它需要分析在线工作平台上活动和交流的纵向数据集,而这些数据集在大多数领域要么不存在,要么不公开。该分析还依赖于识别在线交流中清晰的情感信号。虽然人们可以使用NLP技术从文本中提取情感,但文本表达的模糊性使得人们很难将情感与工作内容区分开。文本也无法捕捉到非语言信号,例如面部表情和手势,而这些真是人们在面对面表达情感时经常使用的。
研究人员选择GitHub作为测试平台。通过GHArchive收集的多年事件日志数据集,研究人员能够追踪开发人员的多种类型的工作活动,例如push、comment、issue等,其中包括GitHub提供的20多种事件类型。他们重点分析了这些情境下表情符号的使用情况。表情符号不仅是情感的载体,而且还代表了丰富的非语言线索,能感知用户的情绪状态和心理健康。

02

前端开发者善用表情符号

仅2018年一年,研究人员就获得了62,852,221篇帖子,探讨了第一个研究问题,即开发人员在GitHub上的交流中使用表情符号的广泛程度,特别是开发人员是否经常在不同的工作活动和不同的编程语言中使用表情符号。有趣的是,他们发现这些帖子中有3-14%包含表情符号,而表情符号的变化取决于开发人员参与交流的类型和他们使用的编程语言。


上图中统计了在Github各个板块上表情的使用情况。除了表中的这些显著差异之外,研究人员还观察到Github上使用的许多表情符号明显与情绪相关,比如面部表情和手势,特别是在评论中回应其他开发人员时,开发者会直接使用表情符号来工作和表达情绪。
表情和你使用的编程语言也是有关系的!


上图展示了编程语言之间的差异,编程语言中,如JavaScript、HTML、TypeScript和CSS,都是表情发帖比例较高的语言。PowerShell是一个例外,可能是因为PowerShell的开发人员较少,且较少使用表情包。不同编程语言中表情符号使用的差异,主要是由于特定开发者社区的不同规范和程序员自身不同个性所导致的。
为了评估表情的使用与所选变量,例如活动时间,活动种类等的联合相关性,该研究以开发者的表情发帖数量和表情发帖比例作为结果变量,进行了一系列线性回归(OLS)。研究控制了开发者的“人口统计学”变量,因为这些变量可能会混淆表情符号使用和工作状态之间的相关性。除了开发者的主要编程语言,研究人员还可以控制开发者们在GitHub上的使用年限。回归的结果表明表情符号的使用高度反映了开发者的工作状态,而不是仅仅由于开发者社区规范所导致的差异。

03

预测远程办公员工的满意度

平均工作时间越长或者post板块应用多的人,使用emoji表情相比其他开发者越多,同时使用emoji表情的比例也越高,相比之下,使用working days的开发者使用emoji表情的比例较低。使用emoji表情的比例越高,说明开发者整体发言或者发帖数量也会减少。活动水平或工作量的增加可能与工作热情或压力有关,而减少则可能反映出工作倦怠。使用push板块的开发者使用更少的表情符号,而在issues,pull requests,comments板块有更多活动的开发者也会使用更多的表情。获取更多评论的开发者也会使用更多的表情,因为在评论区,开发者更倾向于使用标签表达对合作者的赞赏和鼓励。
表情的数量和比例反映了开发者的工作状态,进一步的,研究人员通过表情符号的使用捕捉与工作相关的开发者特征,并用来预测工作结果。研究人员研究了使用表情符号作为一个因素来观察与员工情绪状态和心理健康相关的结果,如激情、抑郁和倦怠,但是这些结果很难在规模上精确衡量。因此,该项研究中选择了一个相关且容易衡量的事件作为预测目标,即在未来一年,开发者是否会在GitHub上不进行任何活动,即退出平台的使用。
研究人员在更细的粒度上描述开发者使用表情符号的情况,用于研究表情符号是否可以帮助预测开发者的退出。研究提取了2018年的表情符号使用特征,并使用它们来预测2018年活跃的开发者是否会在2019年退出GitHub上的工作活动,主要定义为零工作日或每日工作小时数。由于表情符号的使用与活动水平高度相关,并且两者都与编程语言相关,研究人员在预测任务中对这些额外的因素进行了控制。
研究结果表明,如果开发者在他们的post中使用表情符号,他们就不太可能中途退出开发平台,而且当他们撰写更多,但是数量合理的表情符号的post时,退出平台使用的风险会进一步降低。然而,当开发者的post中含有表情符号的比例很高时,相关度会出现不同的变化,因为这些用户可能对表情符号很着迷,表现出了一种潜在的痴迷的激情。

如上图所示,表情符号使用的多样性,主要体现在表情符号的数量和表情符号的熵,都会对开发者中途退出开发平台产生负向影响。表情符号熵越大,开发者退出开发平台的风险越低。表情符号的多样化使用可能表明用户处于良好的情绪状态,并且沉迷或疲劳的风险较低。通过表情符号表达的情绪也显示出与用户中途退出具有很有趣的关系,积极情绪、消极情绪、悲伤和焦虑的情绪得分大多呈负相关,而愤怒的情绪得分则呈正相关。这表明,使用表情符号表达这些情绪,即使是消极的情绪,都能降低开发者退出开发平台的风险。不过,出去研究结果中的这些异常值,研究结果中整体显示的开发者的情绪状态和心理健康与退出开发平台之间呈正相关关系。
总体来说,这项研究表明,开发者使用表情符号,本质上是表达情感的符号,可能是他们在GitHub上投入工作的一个线索,因为使用表情符号的人不太可能退出这个平台。这一发现有助于开发基于表情符号的预测远程工作者工作满意度的工具,或检测愤怒、焦虑和抑郁迹象的系统,可以用于直接对那些正在努力跟上工作进度的员工提供及时的帮助。此外,研究人员认为他们的工作可以激励公司设计提高远程办公人员的幸福感和工作满意度的策略,例如鼓励他们使用表情符号表达积极和消极的情绪。
研究人员说,在他们正在进行的研究中,正在寻找表情符号使用与工作相关结果之间的因果关系,我们正在研究是否可以将表情符号用作一种工具,以帮助提高远程办公人员的办公表现,甚至于在他们想要退出时,及时的挽留。
参考文献:
1.Xuan Lu, Wei Ai, Zhenpeng Chen, Yanbin Cao, Xuanzhe Liu, and Qiaozhu Mei. 2021. Emojis Predict Dropouts of Remote Workers: An Empirical Study of Emoji Usage on GitHub. In Proceedings of ACM Conference (Conference’17). ACM, New York, NY, USA, 11 pages. https://doi.org/10.1145/nnnnnnn.nnnnnnn
2.https://techxplore.com/news/2021-03-patterns-emojis-dropout-remote-workers.html


 

推荐阅读


 

CDA课程咨询

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/110488
 
516 次点击