Py学习  »  Git

NBER: 新冠肺炎期间的劳动力再分配和远程工作:来自GitHub的证据

唧唧堂 • 2 年前 • 234 次点击  

picture from Internet
解析作者 | 唧唧堂经济金融学写作小组:Donuts
审校 | 唧唧堂经济金融学写作小组:SAN, 绵绵
编辑 | 悠悠


专栏推荐


本推文来自唧唧堂《新冠主题社科论文导读专栏》。该专栏计划无限收录经济金融管理学顶刊的新冠主题论文。专栏已收录论文导读99篇,预计未来1周内更新将超过100篇。欢迎扫码订阅!


本文是针对《新冠肺炎期间的劳动力再分配和远程工作:来自GitHub的实时证据》的一篇论文解析,该论文于2021年12月发表于NBER上。该研究作者包括Grant R. McDermott和Benjamin Hansen。


问题提出和假说解释


新的Sars-Cov2病毒(及其引起的疾病covid-19)已经深刻地改变了全球经济。随着持续的疫情爆发和新变异的到来,人们从最初的大流行中逐渐恢复常态。然而,实时数据显示,美国的失业率达到了20%,这是自大萧条以来的最高水平。也许这些变化中最值得注意的是远程工作,或“在家工作”(WFH)。世界各地的城市、州和国家都已实施了各种形式的居家命令来抗击病毒。与此同时,私营公司和公共实体也实施了特定的大规模WFH政策。此外,许多雇主在政府官方要求之前就已发放了内部津贴或WFH授权,并批准了其大部分员工的永久远程工作条款。似乎越来越多的人认为WFH将成为大流行的持久遗产。


尽管发生了这些大规模的社会变化,但远程工作的时间和方式的变化程度仍然是悬而未决的问题。大流行前收集的实验证据表明,某些类型的工人在家使用的生产效率更高。但covid-19期间的WFH可能具有独特的挑战性,因为当时的冲击还带来了由病毒本身造成的压力或疾病。


反过来,大流行早期阶段的大规模关闭学校等政策应对措施可能无意中引发(或加剧)了某些群体不成比例的负担。在大流行期间,仅仅因为传统休闲方式被封锁政策所禁止,个人可能在大流行期间选择做更多的工作。更复杂的问题是,WFH可能预示着团队中的工作和协作方式的变化。


正是在此背景下,本研究旨在进一步理解covid-19对劳动力分配的影响,特别是WFH造成的长期影响。


背景和数据来源


新冠肺炎大流行的时间线和应对措施


Sars-Cov2人际传播的确切来源和时间尚不清楚。2019年12月,在武汉市首次爆发疫情后,中国开始封锁湖北省的几个城市。世界卫生组织于2020年1月30日宣布进入国际公共卫生紧急状态,并于2020年3月11日正式宣布为全球大流行。尽管局部疫情的时间和强度各不相同,但整个2020年2月,全球对covid-19的认识有所提高,而在2020年3月,人们开始广泛意识到新冠疫情的来临。


由此,作者采用2020年的第10周(3月的第一周)作为大流行开始的基线衡量标准。此设定可能未考虑本地化的或公司特定的策略,在某些情况下,这些策略可能更早开始。然而,它也将限制在地理和网络溢出情况下的偏误。作者表示在某种程度上错误地衡量了公司或当地对WFH的转移,但此方法仅会低估WFH对劳动力重新分配的影响。作者还强调,该研究的关注人群并不一定能代表经济中的模式化工人:与餐厅老板及其员工相比,技术专业人士和其他知识型工作者在新冠肺炎疫情期间经历了非常不同的工作压力和工作限制。然而,这一人群非常适合用于测量WFH对工作时间和工作强度的影响。此外,虽然作者无法直接观察远程工作,但像计算机等数字知识领域的工人很容易远程工作,已有研究表明这些工人中的绝大多数在大流行中进行远程工作。


Github 数据


GitHub(www.github.com)是世界上最大的软件开发和科学代码平台,目前服务于超过5000万用户。该平台最初针对的是专业的软件开发人员,但现在却拥有了一个巨大的行业和学术机构的用户基础。GitHub的核心目的是促进对代码和数据的版本控制。具体来说,它允许跟踪单个文件和代码行,以便可以在任何时间点召回项目代码库的早期版本。该平台会自动记录对项目代码库所做的任何更改——是谁制作的,何时制作的,以及它们由什么组成。


在本研究中,作者使用GitHub的数据来调查covid-19导致的活动和工作习惯的变化:重点是记录在公共GitHub时间轴上的活动。此信息均由GitHub的官方API(应用程序协议接口)提供。作者主要采用了以下两个第三方来源——GH种子和GH存档,它们的建立是为了整理整个GitHub平台的信息,以便研究人员访问。此外,尽管在研究中排除了私人的GitHub活动,但作者强调,公共时间表仍然包括了大量的用户和活动。图1描述了2015年至2020年(作者指定研究期)的日常活动时间线。对于大约250万的GitHub注册用户,还可以观察到他们自我报告的地理位置。


作为后期分析的一部分,作者主要关注了六个地区的影响——伦敦、纽约、旧金山、北京、班加罗尔(班加罗尔)和西雅图——并研究用户活动对当地和全球covid-19冲击的反应。最后,虽然GitHub不报告性别,但许多用户报告了他们的名字和姓氏。作者根据从相关人口普查数据中提取的表格频率表,利用这些信息对样本中五个城市用户的性别进行了统计推断。为简单起见,作者排除了不确定的匹配项(例如,男女通用的名称)。由此产生的子样本严重偏向于男性。这种模式在各个城市中始终存在,证实了科技行业缺乏性别多样性。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/126528
 
234 次点击