社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

关于机器学习,你必须知道的几件事丨Q&A机器学习讲座总结

TFT小组 • 5 年前 • 570 次点击  

在31日的机器学习讲座中,我们向对AI&ML有兴趣或是准备进行学习的朋友解答了不少疑惑。今天就以Q&A的形式给大家认真总结一下讲座内容,如果您还有更多的问题可以在评论区留言或者点击【阅读原文】加入小组,让我们为您答疑解惑。

Q: 机器学习在工业界和学术界有什么区别?

A:学术界和工业界的区别其实是很大的,因为使命是不一样的。学术要在做从无到有的东西,做人类的knowledge,而工业侧重于把这个knowledge实现,以应用于人类社会中。


学术领域的需求是:
“找到别人没玩过的东西玩玩”其最终目的是拓宽领域的知识面。


工程项目的需求是:
“用最稳妥的方法,尽可能控制风险,辅助某人或某个团体完成另一件事”





但是学术界和工业界又不是完全割裂的。工业界敢去提某一个产品的设想,是看到了在学术界有一些前沿的成果,可以在工业界来用。同时,工业界也在逐步提炼它的问题,扔给学术界,希望他们去做这种前沿的探索。


Q:机器学习在工业界的前景如何?

A:我很看好机器学习这个领域,尤其是在工业界,很多方向都是大有可为的。尤其是现在对特定领域的机器学习专家有很大的需求,比如object detection,自然语言处理,尤其是很多大公司都拥有自己的实验室,需要很多研究型的人才,现在有很多公司,在中国和在美国都建立了实验室,其实有两种目标。


一方面是长期希望能瞄准将来前沿的领域,做技术的积累;另一方面是要追求产品更好的落地,所以现在很多公司就建起了自己人工智能的实验室,这也是很多学术界的大牛开始进军工业界的原因。


机器学习在工业界的职位基本可以分为两个track:一个是偏研究的Scientist(一般要求Phd),另一个是偏工程的Engineer,目前虽然已经有很多人在做相关的项目,但还是需要大量的人才对机器学习进行工业化。对于很多想转专业的同学,我的建议是越早越好,决定好了之后就赶紧行动。


Q:如何选择学术界还是工业界?

A:我的建议是大家尽可能的早些找到科研机会,先和科研确定一下眼神,如果不是对的人就赶快转向工业界,流连忘返是很容易两手空空的。在学校的同学应该有很多机会可以在大三或者大四跟着学长学姐或者教授进实验室,这是一个很好的体验科研过程的机会,如果1-2个学期之后发现自己不适合搞科研,那就赶紧为实习就业做准备吧。


Q:想要进军机器学习工业界需要做哪些准备?有什么建议?

A:这个问题默认已经对机器学习有一定的了解,并且具备了足够的基础知识。首先就是要打破幻想,了解主流模型,其实工业界的大部分技术没有我们想象的那么炫酷,你很少能看到深度强化学习那种AlphaGo一样酷炫的模型。一般来说广义的线性模型(generalized linear models)已经可以解决大部分的问题了,剩下的一般也逃不过普通任务深度网络、视觉任务卷积网络(CNN)、语音和文字任务递归网络(RNN+LSTM)。所以熟知各种技术是最基本的要求,有了这个基础,才能根据实际问题选择最合适的解决方案。




另外就是要把很多在学术界忽视的步骤重视起来,比如让人深恶痛绝的数据清洗。现实生活中很难得到像CIFAR-10那样干净整洁令人赏心悦目的数据,大部分数据都需要进行一系列的处理,而且一个项目可能有60%-70%的时间都在清理数据,其过程相当痛苦,更糟糕的是很多时候根本得不到足够的数据。这个时候就要发挥想象力,找到如何能够很好的解决或者是绕开这些问题的方法了。


工业界的机器学习是为了多快好省的解决实际问题,对利用各种资源解决问题的能力有比较高的要求,而且要对工业界常用的技术有一定的了解。如果有兴趣的同学可以了解一下Spark,Hadoop以及一些常用的数据库及文件存储系统,这些都是机器学习在工业界常用的工具。


Q:初学者该怎么入门?

A:首先要有正确的认识,机器学习是一个非常大的研究领域,它是指计算机学习过程的自动化,与人工智能有很大的交叠。从深奥的学习理论到机器人技术——这个领域的范围非常广,不可能将它们整个拿下。


所以可以先选择一个小方向(先挣一个亿),比如目标识别,那在计算机视觉领域应用的最广的就是卷积神经网络,以此为出发点,从理论开始,覆盖每一个相关的知识点,理论过关了,就可以自己动手开始搭建模型进行训练了。


当然在这个过程中会有很多陷阱,怎么避开呢?最直接的方法就是让有经验或者曾经掉到过坑里的人带你绕开这些陷阱咯,所以建议大家去上一门课,我们前一篇推文里面有对四门机器学习课程的比较可以供大家参考点击这里阅读,公众号发送【机器学习】获取课程资源集合)。当然也可以选择理论+实践的实用课程,比如机器学习小组的课程(微笑脸)。


9.8-10.8 机器学习小组


Q:为什么Python在机器学习语言中那么重要?

A:首先,之前搞机器学习的那帮人都喜欢用Python,所以Python慢慢就积攒了很多优秀的机器学习库,所谓的库,你就理解为别人封装好的一些具有某些功能的模块,我们可以通过调用这些模块来实现某些功能,而不用自己从头写代码。现在流行的Tensorflow,pytorch这些平台都支持Python。


而且Python也是一个极易上手的语言,对新手非常友好,语法很简单,容易理解,而且实现同一功能的代码量会比一般语言要少一些。


另外,就算你不搞机器学习,如果要学编程,那Python也是个极佳选择,因为Python就像万金油一样,机器学习、数据分析、爬虫、Web 网站、游戏、后台服务、运维都能做。扎实的Python基础不仅对机器学习有很大的帮助,今后在工作中也会对写脚本有很大的帮助。


9.8-10.8 机器学习小组

案例讲解 实践指导 定期答疑

帮你实现小白的真正入门

房价预测,人脸识别,图像识别...

多种实战项目总有一款适合你


↓↓↓点击【阅读原文】了解更多,与我们一起进步


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/IqQmUku4cz
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/23479
 
570 次点击