Python社区  »  Python

即将开班 | Python数据挖掘与结构模型五一工作坊

唧唧堂 • 1 周前 • 22 次点击  

课程概览

时间

  • 2021年5月1-2日(邓旭东)
  • 2021年5月3日 (邓建鹏)
  • 2021年5月4日   (王子)

授课方式

  • 小鹅通APP(线上直播)
  • 每天6小时(8:30—11:30;14:00—17:00)+30分钟答疑
  • Python3.7.5   Matlab R2012b及以上

主讲嘉宾

  • 邓旭东(哈尔滨工业大学)
  • 邓建鹏(上海财经大学)
  • 王子(上海财经大学)
  • 刘文革(课程总策划)
  • 谢杰(课程总协调)

价格

  • 2000元/门(老师);回放10天
  • 可单独购买每位老师的课程

优惠政策

  • 报名两位老师的课程9折;
  • 三位老师的课程8折;
  • 四位老师的课程7.5折;
  • 三人成团及以上九折;
  • 五人成团及以上八折;
  • 老学员九折;
  • 学生优惠200元/人;
  • 各类叠加不超过7.5折。(注:为扩大学员们的选择空间,可单独选择报名一位老师或几位老师的课程,也可组团报名;由于五一假期时间较短,Stata应用能力提升与实证前沿工作坊将于暑期举办,敬请期待))

授课内容

  • 邓旭东
    • python语法入门
    • 数据采集
    • 文本处理
    • 文本分析与机器学习
  • 王子
    • 结构模型方法论与建模
    • 模型求解与估计
    • 反事实均衡求解
  • 邓建鹏
    • 国际贸易研究历史回顾与结构模型
    • Armington模型与McCallum边界效应之谜
    • Eaton-Kortum模型与贸易自由化的福利效应

主讲嘉宾简介

  • 邓旭东:哈尔滨工业大学在读博士。曾在多所大学分享数据采集和文本分析,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等相关内容。

  • 王子:美国宾夕法尼亚州立大学经济学博士,上海财经大学商学院助理教授。主要研究领域为国际贸易、跨国企业和中国经济,在Journal of International Economics、Journal of International Money and Finance、World Economy等学术刊物发表多篇论文。曾应邀在多所高校讲授“结构方程模型方法和应用”短期前沿课程,广受好评。

  • 邓建鹏:美国宾夕法尼亚州立大学经济学博士,上海财经大学商学院助理教授。主要研究领域为国际贸易、经济增长和经济地理。曾在多所高校分享结构模型方法在国际贸易中的应用,反响热烈。

工作坊简介

为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,“python数据挖掘与结构模型及其在国际贸易中的应用五一工作坊”为广大学者提供了一个高水平学术交流、研究方法普及与研究经验分享的平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论与实践相结合,培养学员的社会科学量化分析研究的综合能力。

结构模型又称为结构计量模型,是将经济学模型和统计模型结合,用于估计描述现实的深层参数,模拟现实世界,以便合理地评估政策效果的实证工具。结构模型通过 建立引起因果关系的数据生成具体方式(机制) 的模型来解决简化型中的问题。模型中明确地指明了一些重要的外部因素(如政策)是如何影响通过某些参数来影响参与人决策的,那么通过改变这些外部因素并结合现有数据所估计出来的参数,结构模型便可以提供一系列反事实推断,对政策的制定有重要的意义。政策评估需要建立在理解对政策不变的“深层”参数之上。在结构式方法中,理论和实证的联系是紧密的。由于其建模技术的优雅和深刻,不仅是当今经济政策评估领域的前沿,也是发展经济理论的有力武器,在世界顶级期刊中,采用结构模型建模的文章引起广泛关注和引用,为所在学科的理论发展和政策评估带来深刻的影响

实证研究过程中学者普遍面临数据获取、清洗和编码的两大问题。在前大数据时代,一般使用实验法、调查问卷、访谈或者二手数据等方式,将数据整理为结构化的表格数据,之后再使用计量分析方法,对这些表格数据进行分析。但大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的前两个问题:

  1. 网络爬虫技术 解决 如何从网络世界中高效地 采集数据
  2. 文本分析技术 解决 如何从纷杂的文本数据进抽取文本信息(变量)

前沿分析固然可能会给你的Paper加分,但不理解其理论依据,会导致前沿方法的滥用!会使你的研究大为失色!为此,本工作坊邀请三位走在计量前沿和爬虫文本分析的学者,可谓是强强联手的重磅组合,为青年教师、研究生们集中讲解前沿模型的基本思想、基于Matlab和Python实操估计。在21世纪的第3个十年来临之际,我们与致力于科学探索的您,分享最前沿的知识与技巧!我们努力给您带来最前沿计量理论与扎实操作基础并重的高质量课程!

课程安排

Python-语法入门

  • 5月1日 上午
  • 邓旭东
  • Python跟英语一样是一种语言
  • 数据类型之字符串
  • 数据类型之列表元组集合
  • 数据类型之字典
  • 数据类型之布尔值、None
  • 逻辑语句(if&for&tryexcept)
  • 列表推导式
  • 理解函数
  • 常用的内置函数
  • 文件路径库os库
  • 数据存储csv库
  • 初学python常出错误汇总

Python-网络爬虫

  • 5月1日 下午
  • 邓旭东
  • 网络爬虫原理
  • 发现网址规律
  • 网络访问requests库
  • 网页解析pyquery库
  • 案例 1:豆瓣小说
  • 如何解析json数据
  • 案例 2: 知乎
  • 案例 3: 微博
  • 案例 4: 批量下载多媒体文件
  • 案例 5: 巨潮资讯—批量下载上市公司定期报告pdf
  • 案例 6: 证券从业人员信息
  • 案例 7:api信息爬取
  • 爬虫知识点总结

Python-文本处理入门

  • 5月2日上午
  • 邓旭东
  • 文本分析概述
  • 读取文件中数据(pdf、docx、txt、excel)
  • 数据清洗re库
  • 案例 8: 中文jieba分词及数据清洗
  • 案例 9: 词频统计(词云图制作)
  • 案例 10: 将多文件数据汇总到一个excel
  • 案例 11:中文情感分析(词典法)
  • 数据分析pandas库快速入门
  • 案例 12:对excel中的文本进行情感分析
  • 案例 13:共现法扩展情感词典(领域词典)
  • 从非结构化文本数据中提取结构化数据(文本数据清洗re库)

Python-文本分析与机器学习

  • 5月2日下午
  • 邓旭东
  • 了解机器学习
  • 使用机器学习做文本分析的流程
  • scikit-learn机器学习库简介
  • 文本特征抽取(特征工程)
  • 案例 14:在线评论情感分析(机器学习法)
  • 文本相似性(cos/编辑距离/jaccard)
  • 案例 15: 使用文本相似性自动识别冲击(改变)时间点
  • 案例 16:Kmeans聚类算法
  • 案例 17:LDA话题模型
  • 文本分析在经管研究中的应用
  • 如何在R语言中调用Python的代码

Matlab-结构模型导论及其应用、Eaton-Kortum模型与贸易自由化的福利效应

  • 5月3日上午、下午
  • 邓建鹏
  1. 国际贸易的历史回顾
  2. 何为结构模型
  3. 应用一(理论与实证的结合)
  • McCallum边界效应之谜
  • Armington模型
  • 引力方程和贸易弹性
  • 模型估计(Matlab编程):边界对贸易成本影响和非线性最小二乘法(NLLS)
  • 反事实均衡求解(Matlab编程):边界对双边贸易的影响和双边贸易变化的结构分解
  • 理论观照实证:解决McCallum边界效应之谜
  • 应用二(政策问题的解答)
    • 比较优势回顾
    • Eaton-Kortum模型和均衡定义
    • 引力方程和贸易弹性的估计
    • 均衡的数值解法(Exact-hat Algebra and Convergence algorithm)
    • 反事实均衡求解(Matlab编程):贸易自由化的福利效应

    Matlab-结构模型方法论与理论建模、模型求解与估计、反事实均衡求解

    • 5月4日上午、下午
    • 王子
    1. 简约式估计与结构模型
    2. 结构模型的方法优势与局限
    3. 结构模型执行的基本步骤
    4. 数值求解非线性方程组
    5. 数值求解最优化问题
    6. 结构模型的估计方法
    7. Hat and exact-hat algebra
    8. 结构分解法(structural decomposition)

    报名信息

    • 报名时间: 从即日起
    • 参加对象: 全国高等院校及研究机构从事经济科学研究的青年师生。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。
    • 费用:2000元/门(老师)
    • 缴费信息
      • 单位:杭州国商智库信息技术服务有限公司
      • 开户银行:中国银行杭州大学城支行
      • 银行账户:6232636200100260588
    • 报名咨询
      • 13967800957(同微信)(陈老师)

    Python社区是高质量的Python/Django开发社区
    本文地址:http://www.python88.com/topic/111138
     
    22 次点击  
    分享到微博