Py学习  »  Python

结构模型、Stata实证前沿、Python数据挖掘国庆工作坊

唧唧堂 • 2 年前 • 235 次点击  

工作坊概览

时间安排

点击下方安排,可直接查看各位老师课程内容信息

  • 2021年10月1~2日(Stata-左翔)
  • 2021年10月3~4日(Stata-王非)
  • 2021年10月5、6日(结构模型-邹建文)
  • 2021年10月7、10日(Python数据采集与文本分析-邓旭东)

授课方式:

  • 小鹅通平台(线上直播)
  • 每天6小时(8:30 — 11:30;14:00 — 17:00)+ 30分钟答疑

工作坊团队:

  • 王非(中国人民大学)
  • 左翔(上海对外经贸大学)
  • 邹建文(华中科技大学)
  • 邓旭东(哈尔滨工业大学)
  • 刘文革(课程总策划)
  • 谢杰(课程总协调)

报名费用:

  • Stata(王非老师):2000元;回放10天
  • Stata(左翔老师):2000元;回放10天
  • 结构模型(邹建文):2000元;回放10天
  • Python(邓旭东老师):2000元;回放10天



工作坊介绍

为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,“结构模型、Stata实证前沿、Python数据挖掘”国庆工作坊为广大学者提供了一个高水平学术交流、研究方法普及与研究经验分享的平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论实践相结合,培养学员社会科学量化分析研究的综合能力。

结构模型又称为结构计量模型,是将经济学模型和统计模型结合,用于估计描述现实的深层参数,模拟现实世界,以便合理地评估政策效果的实证工具。结构模型通过建立引起因果关系的数据生成具体方式(机制)的模型来解决简化型中的问题。模型中明确地指明了一些重要的外部因素(如政策)是如何影响通过某些参数来影响参与人决策的,那么通过改变这些外部因素并结合现有数据所估计出来的参数,结构模型便可以提供一系列反事实推断,对政策的制定有重要的意义。政策评估需要建立在理解对政策不变的“深层”参数之上。在结构式方法中,理论和实证的联系是紧密的。由于其建模技术的优雅和深刻,不仅是当今经济政策评估领域的前沿,也是发展经济理论的有力武器,在世界顶级期刊中,采用结构模型建模的文章引起广泛关注和引用,为所在学科的理论发展和政策评估带来深刻影响

实证研究过程中学者普遍面临数据获取、清洗和编码的两大问题。在前大数据时代,一般使用实验法、调查问卷、访谈或者二手数据等方式,将数据整理为结构化的表格数据,之后再使用计量分析方法,对这些表格数据进行分析。但大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的两大问题,即:1. 从网络世界中高效地采集数据 、2. 从纷杂的文本数据抽取文本信息

在获取数据及文本信息后,需要使用计量方法对数据进行分析处理。Stata软件功能日益强大,理论也与时俱进**。**前沿分析固然可能会给你的Paper加分,但不理解其理论依据,会导致前沿方法的滥用, 使你的研究大为失色!

为此,本工作坊邀请五位走在计量前沿和爬虫文本分析的学者,可谓是强强联手的重磅组合,为青年教师、研究生们集中讲解前沿模型的基本思想、基于Matlab和Python实操估计。在21世纪的第3个十年来临之际,我们与致力于科学探索的您,分享最前沿的知识与技巧!我们努力给您带来最前沿计量理论与扎实操作基础并重的高质量课程!



授课内容

左翔

  • 经济学理论和实证研究的关系
  • 因果推断和反事实框架
  • 面板数据模型
  • 双重差分模型
  • 离散选择模型

王非

  • Stata入门技巧及编程方法
  • 工具变量法理论与应用
  • 断点回归设计理论及应用
  • 合成控制理论及应用
  • 因果识别方法若干新发展

邹建文

  • 结构估计的含义
  • 生命周期模型介绍
  • 动态公司金融模型介绍
  • 结构估计的应用
  • 结构估计实例1:居民消费行为分析(研究思路、具体实施步骤、算法和Matlab编程)
  • 结构估计实例2:企业投资行为分析(研究思路、具体实施步骤、算法和Matlab编程)

邓旭东

  • Python语法入门
  • 网络数据采集,网络用户行为数据采集,可自动下载文本、图片、视频、pdf等文件
  • 文本分析,如词频统计、情感分析、信息抽取
  • 机器学习,如LDA话题模型、文本分类等



讲师简介

左翔 :上海对外经贸大学国际经贸学院副教授、复旦大学博士,主要研究领域为公共经济学和发展经济学。主持国家自然科学青年基金项目、教育部人文社科基金青年项目各一项。论文发表于《经济研究》、《经济学(季刊)》、《世界经济》、《世界经济文汇》、《财经研究》等国内重要学术期刊,并获得上海市哲学社会科学优秀成果奖(论文类)二等奖和三等奖各一次。

王非:美国南加州大学经济学博士,中国人民大学劳动人事学院副教授,“杰出学者”青年学者,人大国家发展与战略研究院研究员,全球劳动组织(GLO)会员,中国就业研究所研究员。主持国家自然科学基金青年科学基金项目。主要研究领域为劳动经济学、人口经济学、主观福祉等,在 PNAS, Journal of Happiness Studies, Journal of Population Economics,China Economic Review,《人口研究》等国内外权威期刊上发表多篇论文。曾多次讲授微观实证研究方法,广受好评,《Stata简明讲义》作者。

邹建文 :华中科技大学经济学院数量经济学博士,研究领域为消费、投资等,专注于结构估计研究,在《经济研究》等期刊发表论文。撰写国内首个关于结构估计的讲义《结构估计讲义》,建立个人公众号“经济学结构估计前沿”,曾应邀在武汉大学、上海财经大学、中南财经政法大学、TIDE学会等高校和学会讲授结构估计方法论,广受好评。

邓旭东:哈尔滨工业大学在读博士,曾在多所大学分享Python,运营【公众号:大邓和他的Python】擅长Python、网络爬虫、文本分析、机器学习等内容。


stata(左翔)

10月1日上午、下午

主讲人:左翔

经济学理论实证、因果推断、反事实框架、面板数据

  • 经济学理论和实证研究的关系简介

  • 线性回归模型基础

  • 因果推断和反事实框架

  • 从反事实框架看多元线性回归

  • 处理效应的异质性和交乘项

  • 面板数据模型的基本设定

  • 随机效应、一阶差分和固定效应


10月2日上午、下午

主讲人:左翔

课程安排:双重、三重差分模型、离散模型

  • 双重差分模型的基本原理
  • 多期双重差分模型的设定
  • 平行趋势假设的检验方法
  • 三重差分模型
  • 双重差分模型的研究案例介绍
  • 二元选择模型(logit和probit)基本原理
  • 二元选择模型的系数解释
  • 面板数据中的二元选择模型
  • 多元选择模型简介


stata(王非)

10月3日上午、下午

主讲人:王非

课程安排:Stata软件操作及工具变量法

  • Stata一般化介绍
  • Stata自学方法及技巧
  • Stata编程方法
  • Stata编程:双重差分论文讲解及编程演示
  • 工具变量方法的基本道理
  • 寻找外生工具变量的一般方法
  • 工具变量相关性检验的一般步骤
  • 工具变量方法论文讲解与实操

10月4日上午、下午

主讲人:王非

课程安排:断点回归设计、合成控制及其他

  • 断点回归设计的基本道理
  • 两类断点回归设计及操作步骤
  • 断点回归设计前沿进展
  • 断点回归设计论文讲解与实操
  • 合成控制的基本道理
  • 合成控制论文讲解与实操
  • 因果推断若干新发展及实操


结构模型(邹建文)

10月5日上午、下午

主讲人:邹建文

课程安排:结构估计入门

  • 结构估计的含义
  • 生命周期模型介绍(用于分析居民行为)
  • 动态公司金融模型介绍(分析企业行为)
  • 结构估计的应用(包括但不限于反事实模拟、政策分析)

10月6日上午、下午

主讲人:邹建文

课程安排:结构估计实例

  • 结构估计实例1:居民消费行为分析(研究思路、具体实施步骤、算法和Matlab编程)
  • 结构估计实例2:企业投资行为分析(研究思路、具体实施步骤、算法和Matlab编程)

Python(邓旭东)

10月7日上午

主讲人:邓旭东

课程安排:Python语法入门

  • Python跟英语一样是一门语言
  • 数据类型之字符串
  • 数据类型之列表元组集合
  • 数据类型之字典
  • 数据类型之布尔值、None
  • 逻辑语句(if&for&tryexcept)
  • 列表推导式
  • 理解函数
  • 常用的内置函数
  • os路径库
  • 内置库csv文件库
  • 常见错误汇总

10月7日下午

主讲人:邓旭东

课程安排:数据采集

  • 网络爬虫原理
  • 网络访问requests库
  • json库解析json网页
  • 案例 1:知乎
  • 案例 2:微博
  • 案例 3:批量下载文档、多媒体文件
  • 案例 4:上市公司定期报告pdf批量下载
  • pyquery库解析html网页
  • 案例 5:豆瓣小说区分动态网站与静态网站
  • 区分动态网站与静态网站

10月10日上午

主讲人:邓旭东

课程安排:初识文本分析

  • 文本分析在经管领域中的应用
  • 读取文件中数据(txt、pdf、doc、xlsx、csv)
  • 数据清洗re库-从文本中抽取姓名、年龄、电话、数字等各种信息
  • 案例 6:如何将多个文件中的数据整理到一个excel中
  • 中文jieba分词
  • 案例 7:词频统计、制作词云图
  • 案例 8:共现法扩展情感词典
  • 案例 9:词向量word2vec扩展情感词典
  • 案例 10:中文情感分析(无权重词典法)
  • 数据分析pandas库快速入门
  • 案例 11:使用pandas对excel中的文本进行情感分析

10月10日下午

主讲人:邓旭东

课程安排:机器学习与文本分析

  • 了解机器学习
  • 使用机器学习做文本分析的流程
  • scikit-learn机器学习库简介
  • 文本特征工程-将文本转化为机器可处理的数字向量
  • 认识词袋法、one-hot、Tf-Idf、word2vec
  • 案例 12:使用tf-idf进行情感分析(有权重词典法)
  • 案例 13:使用标注工具对文本数据标注
  • 案例 14:在线评论文本分类
  • 文本相似性计算
  • 案例 15:使用文本相似性识别变化(政策连续性)
  • 案例 16:Kmeans聚类算法
  • 案例 17:LDA话题模型
  • 案例 18: 识别图片中的文本
  • python爬虫、文本分析、机器学习等技术在论文中的应用赏析


报名信息

参加对象

全国高等院校及研究机构从事经济科学研究的青年师生。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。

报名时间

从即日起

缴费信息

单位:杭州国商智库信息技术服务有限公司

开户银行:中国银行杭州大学城支行

银行账户:6232636200100260588

报名咨询

  • 13967800957(同微信)(陈老师)

欢迎咨询!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/120422
 
235 次点击