Py学习  »  机器学习算法

机器学习创造新岗位也带来新问题

网络大数据 • 6 年前 • 328 次点击  

沃特斯:机器学习催生对专业人才的需求,同时也给公司管理者提出了更高的要求,只有具备相关知识才能更有效进行管理



一个新的职业几乎在一夜之间就冒出来并不常见。


而许多设法进入这一新领域工作的人并没有在正规高等教育机构接受过相关正规培训,这种情况也不太常见。

在机器学习(machine learning)以及相关的数据科学领域,职业发展之路与以往其他多数职业的发展路径大相径庭。它代表的不仅是未来几年最有前途的就业机会之一,而且是今天进入职场的人如何适应未来就业需求发展的一种模式。

机器学习指的是将统计学和计算机科学相结合的一项技术,它已经使人工智能领域发生了革命性变化。机器学习依赖于随时间不断改进的一类新的学习算法,以及用于对系统进行培训的大量数据的供应。

许多机构已经对汇集“大数据”所需的IT基础设施进行了投资,一般是打破内部各自为战的格局,对数据采取更加集中化的存储。更加充分利用这些资产的需求导致对专业人才的需求井喷,远远超出了传统计算机科学专业所培养的人才数量。

机器学习并非只向计算机科学家开放。作为一个以数据收集、整理和分析为核心的学科,机器学习横跨了多个专业领域,数学、统计学和编程都是其中的一部分。

许多非专家型高管也会发现,对这一领域略知一二已经远远不够了,因为他们需要与业务一线的机器学习专家进行互动。

没有一个职位描述能够完全涵盖这个新兴领域。现在,许多传统上被称为“数据分析师”的人都渴望获得“数据科学家”的头衔,Kaggle的创始人兼首席执行官安东尼•戈德布卢姆(Anthony Goldbloom)说。他的公司拥有一个非正式的全球各地数据专家网络,今年刚被谷歌收购。他补充说,数据科学家进而渴望成为机器学习专家。

对这些技能的需求呈爆炸式增长,其速度之快使得传统院校课程培养的人才已无法满足需要。根据运行在线开发人员社区的Stack Overflow公司的数据,数据科学家、机器学习专家及拥有统计学或数学背景的开发人员在软件行业薪酬最高的四类职位中占据了三类。Stack Overflow针对这一领域进行的年度调查是同类调查中涉及范围最为广的之一。

人们正通过一些非常规的途径进入这一领域。最近对1.6万名Kaggle用户进行的一项调查发现,只有30%的受访者在正式的大学教育中学习过机器学习或数据科学课程。

相比之下,66%的受访者称他们是自学成才的。略超过半数的受访者表示,他们是通过在线课程学习这一新学科的。

被吸引到机器学习领域的人员来自许多不同专业。戈德布卢姆列举的专业包括物理、计算机科学、经典统计学、生物信息学和化学工程学。这使机器学习成为首个体现出终身学习重要性的新学科。他说:将来,在一个人的整个职业生涯中,无需学习新技能去适应诸如此类的新机会是不可能的。


其他领域的人员适应机器学习的速度也反映了这一学科的本质。


作为一种被称作深度学习技术的先驱之一,斯坦福大学教授吴恩达(Andrew Ng)称,随着该领域的发展,非专业人士进入这一领域实际上变得更容易了。

“让我感到惊讶的是,进入人工智能领域是那么容易。随着深度学习的兴起,我们所使用的算法变得越来越简单,因为我们对数据的依赖更高了,”他说。“几个星期后,你就能阅读该领域领先的研究论文和最前沿的想法。”

吴恩达也是大规模开放式在线课程(Moocs)平台Coursera的创始人。他自己讲授的人工智能课程是第一个在互联网上吸引了大量观众的课程。不过,在学习该课程的人中,最后真正完成的很少。继Moocs之后,又出现了一些结构更完善、目标更细分的在线课程。“知识传播的速度大大加快,”他说。

这门新学科成型速度如此之快,给试图利用这些技能的公司提出了挑战。他们该如何设计能充分发挥这些新型数据专家优势的职位?如何满足这些新员工的期望,并为他们制定一个迈向高级管理层的职业发展路径?高级管理层缺乏技术能力已开始成为这些公司所面临的一个问题。

坏消息是,至少到目前为止,很多公司似乎都没能成功。根据Kaggle的调查,大多数在该领域工作的人称,他们每周都要花一到两个小时找新工作,戈德布卢姆说。

Stack Overflow对6.4万名开发人员的调查结果也印证了上述情况。表示正在找工作的开发人员中,机器学习专业人士名列榜首,占比为14.3%。紧随其后的是数据科学家,占比为13.2%。

戈德布卢姆表示,在这个领域工作的人有很强的挫败感。数据质量不高是主要原因之一:雇主不能给他们提供获取结果所必需的关键原材料。

也有人抱怨说,让他们解答的问题本身就不够明确。公司可能嗅到了机会,但是,对于如何充分利用其数据资产,他们通常缺乏足够的了解。这也凸显出,与数据科学家和机器学习专家一起工作的非专家型管理人员技术知识匮乏的问题。

此外,任何一个新兴职业的先行者都会有挫败感。戈德布卢姆表示,人们抱怨找不到其他可以合作的人才。

那些在互联网上发展壮大、收集大量用户行为数据、并使用诸如A/B测试等技术来不断改进服务的公司才是这些人才的天然归属。要想争夺一些未来的关键人才,其他公司就需要将这些技术作为自己经营的核心。


哪些国家将成为首批机器学习的中心?


Kaggle公司运营着一个数据科学家和机器学习专家的社区网络。它的用户群中,有四分之一来自美国。来自印度的用户排名第二,占比为16%。

但全球的分布数据并不完整:比如,数据没有反映出中国此类人才的现状,因为中国的“防火长城”(Great Firewall)使得该国公民无法加入这些社区。但根据9月份的数据,该网站的月度用户达到16.5万,从一个侧面反应了这一新兴学科的早期发展状况。

在这些用户中,有27%在科技和互联网企业任职,为规模最大的群体。在学术领域工作的占15%,金融与保险领域的用户占14%。

Kaggle通过举办公开的数据科学竞赛,并向竞赛中表现最佳者颁发奖金,来帮助企业与这一新兴领域的人才取得联系。一个有趣的发现是:在Kaggle的用户群中,只有2.5%来自俄罗斯,但在94位“大咖”级——该网站最高级别——用户中,有9位来自俄罗斯。

译者/何黎


 感谢观看!

end



网络大数据

 (ID:raincent_com


网络大数据 www.raincent.com

致力于打造中国最专业的网络大数据科学门户网站。


识别二维码,关注网络大数据




今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/dVhlULI2ve
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/7023
 
328 次点击