社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

经管类学生如何学习机器学习理论?

量化金融科技前沿 • 3 年前 • 288 次点击  

【这是三年前的一篇“老”推文,坦白而言,三年前我们在经管圈谈论“机器学习理论”之时,还有太多圈内人不接受。但是,仅仅三年,一切都“翻天覆地慨而慷”的感觉,总之,百年未有之大变局的时代,每个中国人一定要心胸开阔,不断努力】

 在开始讨论之前,我解释一下 “经管类学生”指的是哪类人?

    我主要指的是国内主要财经类的高校的学生。比如我们首都经济贸易大学,就是一个非常典型的财经类高校。这类高校的特点非常明显。

   这类学校的学生对“机器学习理论”(Machine Learning),是非常陌生的。

    今天的推文,我们并不打算诸如现有网上的关于《机器学习理论》的科普,展开讨论,我们更愿意把最核心的一些问题在这里说一下,进行一个“另类”科普。我们完全站在“财经类”院校的视角来说说《机器学习理论》,而不是现在互联网上《机器学习理论》的科普,因为这类介绍都是计算机系的学生和老师写的,他们的视角还是“深深”的工科思维和计算机科学思维。


我们今天重点说说以下几个问题:

1

"机器学习理论”是什么?


2

再说说它为什么重要?


3

说说财经类高校的学生为什么要学习这个课程?


4

它和计量经济学的关系。


5

如何快速入门。也就是进阶指南。



开始讨论


"机器学习理论”是什么?




    ”机器学习理论“(Machine Learning)是人工智能领域的理论核心课程。任何学科,包括经济学、金融学要想成为一个学科,它必须得和数学(或者统计学)发生亲密接触,建立基于数理(英文该是quantitative,也就是量化)的理论大厦才能算是一个真正的科学学科。人工智能也是如此,机器学习理论是人工智能学的理论学科。


我们对于科学,对于真理始终秉承这样的信仰和信念:

【总069-量化八卦002】说说数学与历史、真理和学派





我们学习新知识,不要太纠结于细节


    对于初学者,希望你们不要过多的纠结于一些国内翻译上的差异,专注于核心知识。初学者可以认为“机器学习理论”基本上和“统计学习理论”是一回事,当然实际上“机器学习理论”的内涵和外延比“统计学习理论”大。

    人类的知识是有很多层次的。学习知识关键是应该学“内核型”的知识,也就是重理论,不要过于偏重于虚无缥缈的“概念”。

    现在很多热的概念,比如:互联网金融、大数据金融、互联网+、云、物联网、区块链,甚至人工智能+各种概念更像是商业炒作。这些都是非常外围的知识,各位同学,必定,大学阶段学习还是扎实点好。学点真知识比较好,少些花架子。


    机器学习理论就是属于内核型知识。学好了机器学习理论,你就能识别那些是虚无缥缈的“概念”,因为虚无缥缈的概念学太多除了让你“迷糊”和你自己的时间被浪费外,其实什么都学不到。


    学好机器学习理论需要什么背景呢?

    其实,具备基本的数理统计知识就够了。

    经管类学校的学生还是开设了不少数理统计的课程。浙大的那本数理统计作为先导课程,其实对于学习《机器学习理论》是够用的。


    任何介绍《机器学习理论》的书籍、网站会告诉你,现在机器学习理论包括三大理论:



1监督学习


2无监督学习


3增强学习


其实初学者用以下的思维记忆机器学习理论的概念就可以了:

监督学习和无监督学习都偏统计学领域。

增强学习理论要学好,对于财经类院校的学生,你可以搞点高级宏观经济学的理论书籍看一看,会更好。主要原因是,增强学习理论最常用的数学工具包括:动态规则、最优控制、马尔科夫过程与蒙特卡罗模拟,这些都是高级宏观经济学非常喜欢的数学工具。



机器学习理论为什么很重要?




    其实前面也说了,《机器学习理论》是“内核型“知识,区分民科和受过正规高等教育训练的专业人员之间,其实差的就是“内核型知识”的掌握(和训练)。这个区分民科和高等教育者之间的判别“定理”,也算是放在哪个学科都是适合的。

    特斯拉的老总Elon Musk说过,他说这个时代所有的商业概念(他指的应该是诸如什么互联网+大数据这样的忽悠不明真相的吃瓜群众的概念)都是前菜(starter),真正的主菜是人工智能产业的兴起。而《机器学习理论》却是人工智能领域的核心理论知识。因此,机器学习理论重要吗?公道自在人心,我们无需多废话,多解释了!至于该不该学,你自己决定嘛!你懂的!



财经类学生为何需要《机器学习理论》


    我有一个高校的好朋友,算是个在计量经济学领域有建树的年轻学者。他有次在一个高校计量经济学会议上说,现在本科的计量经济学教材有点与时代脱节,他建议使用麻省理工Joshua Angrist的《基本无害计量经济学》又或者是Angirst写的《功夫计量》,很多高校老师是同意他的意见的,据说他这个建议还在高校某论坛上被转载了。下图是麻省理工的Joshua Angrist,和他的宝书《完全无害计量经济学》。我们推文曾在一两年前,以前分享过他的介绍,因为年代久远,我找不到了。


可喜的事情。国内普遍高校已经在用新的《计量经济学》的课本了。我有同事说,陈强老师是个默默突然改变了国内计量经济学教育的男人。至少无意间,至少让普遍高校学生的“计量意识”提速15年,至少是从刀耕火种的原始社会时代进化到了前工业文明时代。该书秉承了当代计量经济学的思想-------因果推论!!!


    我说这些什么意思呢?我想说两点:


    第一、当代主流的计量经济学的思想是Joshua Angrist教授的计量思想。这在国内学术圈已无争议。这种思想是什么样的思想呢?说白了,就是重解释“因果推论”。基于因果推论,当代计量经济学也建立起来了严密的分析讨论和分析方法(说俗点就是:套路深深,如果你不认真学习,哪怕你是学统计出身的,也会有很多科研细节搞不懂。搞不懂!那就没法发学术文章了!)。而传统的计量经济学本科教材(我不点名)基本上是一本基于最小二乘法的统计教材,说白了就是......目标不明确,你到底要干嘛?是要搞预测还是要搞解释。搞预测,人工智能领域的学者认为你太不专业。搞解释吧,当代计量的学者认为你的东西太老太过时。传统的计量经济学本科教材的第二部分,一般就是写了些时间序列的知识,然后又无法说清楚具体应用场景财经类高校很多学生的智力认知水平停留在了”格兰杰因果检验“,然后就没有然后了............ 这些传统老套的计量经济学知识,在当代计量经济学者眼里是被摒弃的,所以学生拿着格兰杰因果检验那点认知去发学术文章是基本没啥戏,基本属于直接被鄙视的对象。    如果把传统计量经济学的知识,拿到现实世界中呢?

    哎!这个.....哎!更悲催。业界的人基本不“了”你!

    下面说说我想说的第二点!

    《机器学习理论》是干什么的呢?

    统计学生出了两个”娃',一个是《计量经济学》,一个是《机器学习理论》。统计学其实最会干两个事情!

    第一:解释,也就是因果推论,这也就是当代计量经济学干出了“丰功伟绩”的事情!!!

    第二:预测!!!这就是《统计学习理论》干的事情。

   小结一下,现实世界,业界其实关注的是“黑猫白猫,捉到老鼠就是好猫”的生存原则,这个世界喜欢这样的生存法则。说白了,我们重视理论或者模型的预测结果!!!

    要是你的模型预测准,也许我们并不知道为何会如此,内部的因果关系为何?但we like it, we love it,we use it.

    所以,现实世界,实务界,人人都爱《机器学习理论》。

    财经类高校学生,你们是时候学点《机器学习理论》了。


机器学习理论和计量经济学的关系


    前面其实基本解释清楚了机器学习理论和计量经济学的关系。

    当然还需要强调一下,《机器学习理论》的增强学习理论,应该不算统计学的范畴。

    经济学里面有两种研究方法:一种叫结构型(structural form)研究方法,一种叫简约型(reduced form),简约型基本都认为就是利用计量经济学的方法研究(可以认为是统计学范畴),而结构型比较特殊,其实如果我们要类比,不妨这么类比:



划重点

监督学习和无监督学习类似于经济学的简约型。

而增强学习理论类似于结构型研究方法。

这也就是我前面为何建议各位如果,如果是经管类的学生想学习增强学习,为何不妨结合高级宏观经济学模型一起研究的原因。


当然,对于初学者,尤其是财经类高校的学生,你可以也可以这么简单记忆。


不妨认为:机器学习理论关注预测,而计量经济学(乃至整个经济学)关注解释。



如何快速入门


第一步,买书,买以下这本书。特别说明一下,学习这本书,不需要计量经济学的背景知识,也许初级计量经济学的知识对你反而是有害的。该书背后的案例使用R语言实现的,建议你们学习Python。

第二步,学习Python。安装Anaconda软件。具体安装说明可以见以前的推文。

【总0195-量化讲堂085】如何安装Python?

第三步,学习sci-kit软件包。sci-kit软件包是Anaconda里面自带的。

然后访问Sci-kit的主页,该主页上有教学和案例。

http://open.163.com/special/opencourse/machinelearning.html

第四步,学习吴恩达的公开课。当然这步可以和前面几步结合起来。

吴恩达的公开课在网易公开课里面有。

http://scikit-learn.org/stable/user_guide.html



总结


    当然你要是能一边学习《机器学习理论》又一边学习《高级计量经济学》,我觉得国家需要的复合型人才,一定就是你!民族实现复兴指日可待,何愁大业不成。

    当然你可能要问,“深度学习理论”该去哪里学?

    你先学好基础好不好,学好了基础,你再去攀登科研高峰嘛!

    先把这些基础知识学了,下一步可以学习深度学习理论(如果你真想搞懂,而非仅是用用某个软件包,跑点软件包里的案例,然后把结果放在网上,装装大神。)

    当然你可能还要问,学好了以上我推荐的《机器学习理论》后到底算个啥水平?

    客观而言,算是顶级高校的本科大三、大四水平吧!一般国外高校的研一水平。

    不要灰心。必定世界很大,能人很多。

    如果你认为你未来的人生是星辰大海,那么第一步,你要做的是:

Keep Calm and Believe in Yourself.

同时还要

Don't Panic!

  

  要学的东西很多,所以发展路径和学习路径最好不要错,这也是我写这个推文的目的。

    我写这个文章耽误了我两小时做科研,对我自己的福利是一种损耗,写推文也不计入高校科研考评,但是我觉得,作为高校老师,需要把正确的知识推广出去,让足够多的年轻人知道该知道的正确知识,这对我们这个国家是有利的。不管如何,看到这个文章的年轻人,一定会有一些收获的,所以写这个“口水型”文章对社会整体的福利是有那么一点提高的,不是完全是无用的。

    所以我还是决定写了这样一个文章,希望对你们年轻人有帮助。

    如果年轻人,你们觉得好!就请把文章转出去,让更多的年轻人知道(该如何规划你们大学的学习时间)。


    最后如果有对宏观经济学,尤其是结构型经济学研究感兴趣的同学,我可以推荐几本书。其实以前也推荐过。这是另外一个“世界”另外一个“平行宇宙”,虽然数学理论都那么相似。

关于



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/106392
 
288 次点击