Py学习  »  机器学习算法

在带了5年算法团队后,我想对机器学习新人说...

痴海 • 4 年前 • 1024 次点击  

大家好,我是chris,工科硕士出身,入行前5年在一家上市游戏公司做算法,从数据挖掘算法在业务线落地开始,涉及机器学习、深度学习,后来逐步负责整个算法团队建设。


现在就职于阿里,也是负责算法方面工作,涉及到的领域涵盖CV、NLP、网络发现等,业务线也扩展到广告、运营、客服、风控等各个方面。


在选择硕士方向时,结合当时的各方信息,个人认为数据科学会在未来的30~50年蓬勃发展。所以选择当时没多少人选的模式识别,从今天回头看,眼界和选择有时候真的非常重要。


工业界人工智能是什么样的?


在我从事算法岗的这几年,人工智能确实发展十分迅速,不再局限于实验室,大规模的商业应用开始出现,特别是在人脸识别、语音识别、广告推荐、金融风控等领域有十分广泛的应用。


目前,我国人工智能、深度学习等领域依然有很大的人才缺口,预计2030年就有超过500万人才缺口,说各家公司砸钱“抢”人也毫不过分。


2018年最新数据:python、大数据、人工智能从业者薪资表


李开复就说过,“在硅谷,做深度学习的人工智能博士生,现在一毕业就能拿到年薪200万到300万美元的录用通知,三大公司(谷歌、脸书和微软)都在用不合理的价钱挖人。而在我的身边,算法岗3年以上月薪3万(并不是大厂)以上很常见。


我适不适合机器学习?


时至今日,人工智能已经成为了独立学科,并且开始对本科学生开放,随着开源框架层出不穷,使得算法门槛逐渐降低,很多 AI 新人可在短时间内熟悉标准化的开源工具进行实战


经常有人询问我自己适不适合机器学习以及学习路线。在我以往的经历中,下类几类人转人工智能水到渠成:


①数学、统计等理工类应届生。理工类学生往往较好的数学基础,虽然数学理论运用在工程实践中优先级不是很高,但想要深入机器学习,理论知识往往决定了你能走多远。


②Python及其它开发语言使用者。对于跨职业向人工智能发展的开发者来说,熟悉项目开发流程能很好地帮助我们理解算法原理和应用场景,尤其是python语言使用者,优势十分明显。


③数据分析师。所有抛开大数据的人工智能是伪科学,数据分析也是入门机器学习的必备技能。


④其它互联网岗位。在人人编程的年代,懂一点技术总没错。特别是作为用户和技术纽带的产品经理,懂人工智能技术在垂直领域有不小的职业加分项。


那么要怎么入门机器学习?


机器学习是一门融合概率论、线性代数、凸优化、计算机、神经科学等多方面的复杂技术,常常让人觉得晦涩难懂。但撇开学术界需求,其实大部分人最终不会从事算法研究,而会奋斗在一线应用领域。


如何入门机器学习,我建议从实际工程角度出发逆推出能力模型。我们先来用一个小型NLP项目流程来举例,让大家了解机器学习项目有哪些大的环节:



1.获取数据。包括业务部门、公司积累大量的文本数据和自己网上下载、爬取的数据,然后进行加工。


2.数据预处理。数据处理大概会占到整个50%-70%的工作量,通过数据洗清、分词、词性标注、去停用词四个大的方面来完成语料的预处理工作。


3.特征工程。做完语料预处理之后,接下来需要考虑如何把分词之后的字和词语表示成计算机能够计算的类型。把中文分词的字符串转换成数字,有两种常用的表示模型分别是词袋模型和词向量。


4.特征选择。 构造好的特征向量,是要选择合适的、表达能力强的特征。特征选择是一个很有挑战的过程,更多的依赖于经验和专业知识,并且有很多现成的算法来进行特征的选择。


5.模型训练。对于不同的应用需求,我们使用不同的模型,传统的有监督和无监督等机器学习模型,如 KNN、SVM、Naive Bayes、决策树、GBDT、K-means 等模型;深度学习模型比如 CNN、RNN、LSTM、 Seq2Seq、FastText、TextCNN 等。


6.评价指标。训练好的模型,上线之前要对模型进行必要的评估,目的让模型对语料具备较好的泛化能力。


7.模型上线应用。模型线上应用,线下训练模型,然后将模型做线上部署,发布成接口服务以供业务系统使用。


我们可以看到一个机器学习项目的完成,开发者除了要具备数学与编程语言基本能力外,实际上更多是对具体算法、模型运用要求,而且面对具体业务也要有相应的图像、语音、NLP等深度学习知识。


为了能具体解决初学者人工智能入门难的问题,我特地邀请了三位人工智能领域的专家,包括一位清华AI博士@Beck Wang,一位计算机视觉方向的专家@Angela,一位百度的数据挖掘工程师@熊猫酱,以具体工作流为核心,针对学习者各个机器学习核心能力进行培养,举办了一个为期8天的人工智能训练营。



我们将分别从各自擅长的四个领域:python数据分析、机器学习理论、机器学习数学、算法工作流,以我们在大厂具体工作流逆向指导理论学习,规划学习路线,是不可多得的入门级课程,旨在为广大的AI爱好者和跨行学习者提供坚实的基础。


学习形式:


1.全程直播形式

2.作业1V1批改

3.助教跟班

4.交流群答疑

5.结业测试

(*结课后可领取录播视频,时间较少的小伙伴也不必着急哦~)


8天入门人工智能特训营

5月19日-26日

课程大纲:

同时,为了保证学习质量,本次训练营限量300名学员免费学习,这里不仅仅有干货,还有导师尽心为你在线解答疑问,更有同伴一起相互监督鼓励,这些福利都限时免费!


扫描下方的二维码

添加助教小姐姐微信

回复“人工智能”

即可抢占人工智能免费车票

交流群直播期间还会放出实物抽奖

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/33273
 
1024 次点击