在大数据与人工智能新时代,数字化转型已经在各行各业如火如荼地展开,那么作为社会科学的科研工作者,我们如何进行数字化研究。如果你还在为研究中如何使用机器学习算法而焦虑,同时又为看不懂计算机领域编写的机器学习书籍而担心时,那么本书正好适合你。
《机器学习与社会科学应用》是一本关于在社会科学研究中如何使用机器学习算法的书。作者力求以更加通俗易懂的语言,较少的数理推导,阐明相关的机器学习算法原理,并通过大量科研案例和实战代码,以读者能够看得懂会使用为目的,为读者呈现了一个全新的视角,让人仿佛置身于科技的学术前沿。无论你是从事社会科学研究的学者、还是对机器学习充满好奇的普通读者,这本书都将给你带来全新的启发和思考。快来一起探索未来吧!
目前教材已在上海财经大学出版社正式出版,各大购书网站可购。
教材简介
本教材将主要介绍机器学习的基本原理,以及他们在社会科学中的应用。本书的定位是面向熟悉计量经济学、因果识别理论,但不熟悉机器学习的社会科学研究者。因此本书将更加侧重于以浅显直白的语言介绍机器学习的基本原理,并以文献综述、案例详解等方式,介绍机器学习各个算法在社会科学实证研究中的代表性应用。而且,为了提高本书的可读性和接受度,我们尽量使用了比较通俗的语言来解释各个机器学习算法的原理,尽量不使用数学公式和艰涩的术语。对于代码实操,本书也尽量选取了贴近社会科学研究者的案例,进行详细阐述。

教材大纲
第一章 机器学习基本原理与启示/ 1
第一节 为什么需要学习机器学习/ 1
第二节 机器学习的基本任务/ 5
第三节 机器学习基本原理/ 9
第四节 机器学习的应用与启示/ 18
参考文献/ 21
第二章 经典回归算法/ 24
第一节 OLS回归算法/ 24
第二节 岭回归算法/ 33
第三节 Lasso回归算法/ 41
第四节 算法调参/ 49
参考文献/ 57
第三章 经典分类算法/ 59
第一节 分类算法简介/ 59
第二节 K近邻算法/ 61
第三节 朴素贝叶斯算法/ 70
第四节 决策树算法/ 75
第五节 支持向量机算法/ 83
第六节 分类算法评估/ 92
参考文献/ 95
第四章 自然语言处理入门/ 97
第一节 自然语言处理的基本任务/ 97
第二节 分词/ 103
第三节 TF-IDF/ 116
第四节 文本相似度/ 121
参考文献/ 134
第五章 集成算法/ 136
第一节 集成算法基本原理/ 136
第二节 随机森林算法/ 139
第三节 梯度提升树算法/ 146
第四节 XGBoost算法/ 152
参考文献/ 158
第六章 无监督学习算法/ 159
第一节 无监督学习简介/ 159
第二节 聚类算法/ 161
第三节 降维算法/ 168
第四节 LDA主题模型/ 175
参考文献/ 191
第七章 深度学习算法/ 193
第一节 神经网络基本原理与前馈神经网络/ 193
第二节 卷积神经网络/ 207
第三节 循环神经网络/ 217
第四节 Word2Vec词嵌入算法/ 223
第五节 大语言模型简介/ 229
参考文献/ 235
第八章 特征工程入门与实践/ 237
第一节 特征工程简介/ 237
第二节 特征理解:探索性分析/ 238
第三节 特征增强:清洗数据/ 244
第四节 特征构造:生成新数据/ 261
第五节 特征选择:筛选属性/ 263
第六节 特征转换:数据降维/ 270
参考文献/ 272
第九章 机器学习与因果识别/ 273
第一节 机器学习助力因果识别的基本逻辑/ 273
第二节 更好识别和控制混淆因素/ 275
第三节 更好地构建对照组/ 279
第四节 更好地识别异质性因果效应/ 287
第五节 更好地检验因果关系的外部有效性/ 291
第六节 大数据和机器学习对因果识别的冲击/ 292
第七节 未来展望/ 295
参考文献/ 296
第十章 机器学习与异质性政策效应分析/ 306
第一节 异质性政策效应评估的价值和传统方法/ 306
第二节 传统异质性政策评估方法的问题/ 311
第三节 机器学习在异质性政策效应评估中的应用/ 315
第四节 机器学习的局限以及未来方向/ 324
参考文献/ 330
教材负责人简介
郭峰,复旦大学经济学博士,北京大学金融学博士后,现为上海财经大学公共经济与管理学院投资系教授、博士生导师、系主任,教育部青年长江学者,上海财经大学数实融合与智能治理实验室执行主任,上海财经大学富国ESG研究院副院长,上海财经大学滴水湖高级金融学院双聘教授,北京大学数字金融研究中心特约高级研究员。研究领域包括数字经济与数字金融、机器学习与大数据分析,以及公共经济学等范畴。在《经济研究》(2篇)、《管理世界》(3篇)、《经济学季刊》(6篇)、《管理科学学报》,Research Policy,Journal of Economic Behavior & Organization,China Economic Review 等中英文期刊上发表论文50余篇,其中11篇论文引用率破百,2篇论文引用率破千(《经济学季刊》创刊以来引用率最高3篇论文中的2篇)。另在主流媒体发表经济时评90余篇,出版专著3部,合(参)著多部。主持国家社科基金青年项目、上海市哲学社会科学规划项目、博士后科学基金面上项目等课题10余项。个人主页:http://www.guof1984.net/

“上海财经大学数实融合与智能治理实验室”简介
“上海财经大学数实融合与智能治理实验室”现为上海财经大学院级教学科研平台,负责人为公共经济与管理学院郭峰教授。实验室的宗旨在于利用人工智能、大数据等新工具赋能传统财经学科,以现代信息技术与传统财经学科的交叉创新,促进数字经济与实体经济深度融合,助力数字中国高质量发展。实验室历来注重教学与科研的融合,始终秉持着在教学中发掘人才、在科研中培养人才的学术初心。实验室相关学术成果发表于《经济研究》《管理世界》《管理科学学报》《经济学季刊》等中文顶级期刊和Research Policy、Journal of Economic Behavior & Organization、China Economic Review 等英文期刊,实验室开发的Python在线课程已在“智慧树”平台面向全网开放。同时,实验室还通过学术报告、公众号推文等,服务数字经济学术共同体,截止到2024年5月,实验室已经举办100多场数字经济、机器学习等相关主题的Workshop,并在公众号上发布80余篇文献和技术推文,公众号关注人数超过10000人。实验室未来将继续聚焦数字经济前沿领域,积极通过科学研究、人才培养、数据库建设、社会服务等活动,致力于建设成为引领学科发展、服务国家战略的重要平台。
注:之前通过实验室公众号举办过赠书活动,7月份将根据赠书名单逐一快递,请耐心等待。
