Py学习  »  机器学习算法

公共数据库、DID、双重机器学习、顶刊复刻、因果推断、质性研究等

学术严选 • 4 月前 • 217 次点击  



课程名称售价(元)

1.常用公共数据库全流程复现——从数据清洗到实证分析(用于微观调查数据库)

799
2.经管类顶刊全流程复现课程——理论框架+计量模型+指标复刻+实证方法(用于国泰安、面板数据处理)
899
3.写作从模仿开始——12小时深度复现课程599
4.DEA数据包络分析方法及软件使用
599
5.DID前沿模型从入门到精通——基于STATA的应用599
6.基于双重机器学习的前沿因果推断
799
7.空间计量经济学
699
8.零基础掌握Stata实战和CHARLS数据库处理499
9.七大老年健康数据库挖掘课程!(R语言)
999
10.从零基础掌握Python机器学习与深度学习
999
11.社会科学中的因果推断(视频版,无答疑)699
12.利用ChatGPT4撰写标书与论文(视频版,无答疑)
599
13.零基础到高手:成为优秀的质性研究者
599
合计
9387



购买请具体咨询陈老师:xsyxkf001



【课程介绍】

【课程01】常用公共数据库全流程复现——从数据清洗到实证分析

📢 【重磅课程】中国公共数据库全流程复现训练营:从数据清洗到顶刊复现,解锁科研新范式!——覆盖CHARLS/CFPS/CGSS等国内外大型权威数据库,持续更新,助力你的学术跃迁!

课程目前已包含:480分钟视频,7.5万字讲解文稿,7800行代码,185万条数据,纯实操,并将持续更新!

🔥 课程核心亮点
1. 全流程实战教学,纯实操课
  • 从零到顶刊:覆盖数据获取→清洗→变量构建→模型分析→结果可视化→论文复现全链条,手把手教你复现顶刊论文。
  • 大型数据库全覆盖:CHARLS(老龄化健康)、CFPS(家庭追踪)、CGSS(社会综合调查)、CLHLS(老年健康影响因素)等,满足多学科研究需求。

2. 年度持续更新
  • 首年6篇已上线:涵盖长期护理险、数字经济、家庭代际转移、慢性肾病、电商进农村、生育意愿等热点课题。
  •  每年新增≥6篇:紧跟学术前沿,新增文献选自权威期刊,确保课程内容与时俱进。
3. 顶刊复现案例深度拆解
  • 经典+前沿结合:如复现“长期护理保险对家庭代际转移支付的影响”“电商进村政策实施的就业效应与机制分析”等。
  • 代码+数据全公开:提供清洗代码库、变量标签手册、模型调试技巧,助你避开80%的复现陷阱。
🔥 课程模块
模块1:数据库获取:数据库介绍(CHARLS/CFPS/CGSS/CLHLS)、数据申请合规指南、问卷与变量匹配技巧;
模块2:数据清洗与变量:多期数据纵向匹配(如CHARLS 2011-2020五期数据整合);异常值诊断、缺失值多重插补;综合变量构建等;  
模块3:高级分析方法与模型应用:面板固定效应模型、中介/调节效应检验、因果推断利器:工具变量法、断点回归、双重差分(DID)、生存分析、限制性立方样条等;
模块4:顶刊论文复现实战(6篇已上线)  
1. CHARLS数据库(三篇):
(1)Risk of fall in patients with chronic kidney disease: results from the China health and retirement longitudinal study (CHARLS),BMC public health,2024.
(2)长期护理保险对家庭代际转移支付的影响,金融评论,2024.1
(3)医养结合与老年人健康养老,财经研究,2022.4
2. CFPS数据库(两篇):
(1)电商进村政策实施的就业效应与机制分析,中国农村经济,2024.4
(2)数字经济对灵活就业的影响效应:基于数量和质量双重视角.中国软科学,2024.11
3. CGSS数据库(一篇):
(1)全面两孩政策后性别角色态度对生育意愿的影响研究
全文链接
https://pan.baidu.com/s/1qO_yMrQxSaD5IhG1vBwk6w?pwd=1234 
复制这段内容后打开百度网盘手机App
🔥 适合人群
  • 科研新手:经管、社科、公卫领域硕博生,急需规范实证研究技能

  • 高校教师:希望提升论文质量、冲刺SSCI/C刊  

  • 数据分析师:需掌握大规模社会调查数据的深度挖掘  


【课程02】经管类顶刊全流程复现课程——理论框架+计量模型+指标复刻+实证方法

【10篇顶刊论文复现主要内容】

[1]方先明,胡丁.企业ESG表现与创新——来自A股上市公司的证据[J].经济研究,2023,58(02):91-106.

学科领域:环境经济学;创新经济学

主要复刻指标:企业创新;ESG表现;融资约束;员工创新效率;风险承担

主要复刻实证方法:描述性统计+基准回归+稳健性检验(工具变量+Heckman+异质性分析+两步法机制检验+拓展分析【已完成复现】

 

[2]文茜,李万利,申志轩.地方政府释放财政压力的微观传导机制:企业盈余管理视角[J].世界经济,2023,46(10):91-114.

学科领域:财政学;会计学

主要复刻指标:财政压力;盈余管理;企业避税;企业投资;企业捐赠

主要复刻实证方法:描述性统计+基准回归+稳健性检验+两步法机制检验+异质性分析

 

[3]胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21.

学科领域:公司治理;文本分析;机器学习

主要复刻指标:管理者短视主义;长期投资;公司治理;分析师关注

主要复刻实证方法:相关性分析+基准回归+稳健性检验(两阶段残差介入法)+中介效应

 

[4]沈坤荣,乔刚,谭睿鹏.国家级大数据综合试验区设立与就业增长[J].中国工业经济,2024,(12):5-23.

学科领域:政策评估;劳动经济学

主要复刻指标:大数据试验区就业地区创业水平;企业生产率;政府补贴

主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势检验+除混淆政策干扰+置换检验+双重差分的异质性处理效应)+两步法机制检验

 

[5]杜勇,张欢,陈建英.金融化对实体企业未来主业发展的影响:促进还是抑制[J].中国工业经济,2017,(12):113-131.

学科领域:公司金融;会计学

主要复刻指标:金融化企业未来主业发展投资效率实物资本投资

主要复刻实证方法:描述性统计+组间差异检验+基准回归+调节效应+稳健性检验(工具变量+非线性关系+双重聚类调整+中介效应 

 

[6]祝树金,申志轩,文茜,.经济政策不确定性与企业数字化战略:效应与机制[J].数量经济技术经济研究,2023,40(05):24-45.

学科领域:宏观经济学;数字经济学

主要复刻指标: 经济政策不确定性企业数字化战略经营成本和经营风险市场竞争程度

主要复刻实证方法:描述性统计+基准回归+稳健性检验(PSM+工具变量法+双重聚类调整+两阶段模型机制检验

 

[7]王文蔚.气候冲击与企业违约风险:基于物理风险的视角[J].世界经济,2025,48(03):90-110.

学科领域:环境经济学;公司金融

主要复刻指标:企业违约风险气候冲击;实体经营;企业成本转嫁能力信息披露质量.转型风险

主要复刻实证方法:描述性统计+基准回归+稳健性检验+三阶段模型机制检验

 

[8]聂辉华,阮睿,沈吉.企业不确定性感知、投资决策和金融资产配置[J].世界经济,2020,43(06):77-98.

学科领域:公司财务;公司金融

主要复刻指标:企业不确定性感知金融化融资成本相对收益风险比; 

主要复刻实证方法:描述性统计+基准回归+稳健性检验(联合固定效应+工具变量)

 

[9]叶永卫,陶云清,王琪红,.税收激励、人力资本投资与企业劳动生产率——来自2018年职工教育经费税前扣除政策的证据[J].数量经济技术经济研究,2023,40(05):136-157.

学科领域:劳动经济学;财政学

主要复刻指标:职工教育经费税前扣除政策人力资本投资企业劳动生产率税收负担;资本密集度+经营绩效+员工工资和劳动收入份额

主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势+安慰剂检验+PSM-DID+两步法机制

 

[10]沈坤荣,乔刚,林剑威.智能制造政策与中国企业高质量发展[J].数量经济技术经济研究,2024,41(02):5-25.

学科领域:政策评估;公司金融

主要复刻指标:智能制造政策TFP;生产经营效率;,信息化能力人力资本结构; 数字基础设施建设

主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势+安慰剂检验+PSM-DID+两步法机制+异质性分析



【课程03】写作从模仿开始——12小时深度复现课程(数据+全套代码)

课程内容(售价599元)

模块一:数据与变量
1.上市企业研究数据库

1.1 CSMAR数据库、CNRDS数据库(重要子库,子指标、预处理、注意事项) 

2.变量生成

2.1 变量选择框架(Libby’s box) 

2.2 常用变量生成与解析(数字化转型、企业创新、融资约束SA、WW、KZ、FC,盈余管理、公司治理、企业办公地、风险承担等)

3.全流程回归前数据预处理

3.1 标准化CSMAR、CNRDS下载EXCEL预处理

3.2 数据横向合并(merge)、纵向合并(append),转置(reshape)、其他合并joinby

3.3 指标简单计算;增长率相关计算

3.4 变量初始调整;滞后相关处理;缺失值相关处理

3.5 循环处理(foreach forvalues while)

3.6 其他

模块二:基准回归
1.基准回归理论讲解(在于讲懂原理,无复杂公式推导)

1.1合适标准误选择问题:稳健、聚类稳健、Bootstrap等;聚类层级选择

1.2 多元线性回归与FWL定理

1.3 OLS与FE选择:FE不一定最优

1.4 统计显著性与经济显著性;回归系数过大或过小

1.5 遗漏变量偏误方向:低估还是高估

1.6 其他

2.基准回归实证操作(以复刻《数字化转型与企业创新为例》)

2.1 缩尾;初始剔除标准;vif

2.2 期刊论文常见表格输出(四表(描述性;相关性;组间差异与基准回归))

2.3 不同导出命令对比 esttab outreg2 reg2docx

2.4 其他问题

模块三:稳健性检验
1.稳健性检验理论

1.0 敏感性分析方法(Altonji方法;oster方法)

1.1 IV(工具变量选择;相关性与外生性;常用工具变量;弱工具变量与过度识别)

1.2 Heckman检验(样本选择模型与处理效应模型)

1.3 非线性模型(泊松与负二项、logit与probit、tobit、ppmlhdfe)

1.4 PSM方法

1.5 排除替代性解释

1.6 其他稳健性检验(替换核心变量;聚类与固定效应调整; 联合固定效应与时间趋势项等)

2.稳健性检验实证操作(以复刻《数字化转型与企业创新为例》)

2.1 IV(ivreghdfe;结果导出;常见指标分析)

2.2 Heckman检验(命令选择;操作细节与结果导出)

2.3 PSM 全流程操作

2.3 非线性模型(命令使用细节与注意事项)

2.4 其他稳健性检验具体回归命令使用

模块四:进一步分析
1.机制检验(以复刻《数字化转型与企业创新为例》)

1.1 概述;机制检验的目的

1.2 三步法模型理论与实操

1.3 江艇两步法模型理论与实操

1.4 交乘项模型做机制检验与实操

1.5 分组做机制检验与实操;组间系数差异检验方法

2.常见进一步分析方法

模块五:《数字经济、创业活跃度与高质量发展》复刻
1.相关基础数据下载

2.被解释变量经济高质量发展水平构建

3.解释变量数字经济发展水平构建

4.复刻之描述性统计、基准回归、中介效应回归

5.复刻之门槛效应回归、空间溢出效应回归

6.复刻之异质性回归于稳健性检验(含工具变量、DID、安慰剂检验)

【课程04】长期回放+答疑!新质生产力和生产效率分析——DEA数据包络分析方法及软件使用(含软件+全套代码)

课程内容(售价599元)

第1课:生产理论与模型概述(1-2课时)

• 生产函数的定义与性质

• 生产要素与生产关系

• 生产的规模报酬与规模经济

• 效率概念及其衡量方法

• 经典生产效率模型的构建

• 经典论文复现(包括生产理论相关的经典文献)

第2课:GAMS软件入门与经典模型应用(2课时)

• GAMS软件的基本功能与操作

• 绿色效率模型、结构效率模型、利润效率模型、非凸效率模型的GAMS实现

• 案例分析:利用GAMS进行经典生产效率模型的测算

第3课:新质生产力测算与GAMS应用(2课时)

• 新质生产力的内涵与特征

• 相应测算模型介绍

• 新质生产力测算模型的GAMS构建

• 综合案例分析:利用GAMS进行新质生产力与生产效率的实证分析(尽量选取相关顶刊或知名论文中的医疗案例进行复现)

第4课:DEA方法与GAMS实践(2课时)

• DEA方法的基本原理与步骤

• DEA模型在GAMS中的实现

• 案例分析:利用GAMS进行DEA效率分析

第5课:医疗行业的生产效率分析(2课时)

• 医疗行业生产效率的特点与挑战

• 医疗行业生产效率的GAMS测算模型

• 案例分析:利用GAMS分析医疗行业的生产效率(如医院、诊所等)

第6课:课程总结与未来展望(1-2课时)

• 课程内容回顾与总结

• 综合案例分析:新质生产力与生产


【课程05】DID前沿模型从入门到精通——基于STATA的应用

课程内容(售价599元)

第一天:Stata基础操作与传统DID、多期DID

课时1Stata基础操作

·1.1 Stata软件简介与安装

o1.1.1 Stata软件功能介绍

o1.1.2 Stata软件安装与界面介绍

·1.2 数据管理与操作

o1.2.1 数据导入与导出

o1.2.2 数据清洗与整理

o1.2.3 变量生成与转换

·1.3 Stata基础命令与操作

o1.3.1 常用命令介绍

o1.3.2 数据描述性统计分析

o1.3.3 图形生成与编辑

课时2:传统DID

·2.1 课程导言

o2.1.1 政策评估的重要性与DID方法的引入

o2.1.2 DID方法的基本原理与假设条件

o2.1.3 传统DID方法的适用场景与局限性

·2.2 传统DID模型构建

o2.2.1 潜在结果框架与反事实推断

o2.2.2 DID模型的基本设定与公式表达

o2.2.3 平行趋势假设的解释与重要性

·2.3 传统DID Stata实现

o2.3.1  数据准备与预处理

o2.3.2  DID模型的Stata实现步骤

o2.3.3  结果解读与稳健性检验

o2.3.4 案例分析:传统DID在政策评估中的应用

课时3:多期DID(渐进DID

·3.1 多期DID方法概述

o3.1.1 多期DID与传统DID的区别与联系

o3.1.2 多期DID方法的适用场景与优势

o3.1.3  多期DID模型的基本设定与假设

·3.2 多期DID模型构建

o3.2.1 动态效应模型的引入

o3.2.2 多期DID模型的公式表达与解释

o3.2.3  平行趋势假设在多期情境下的检验

·3.3 多期DID的扩展与高级应用

o3.3.1 安慰剂检验在多期DID中的应用

o3.3.2  三重差分模型(DDD)与多期DID的结合

o3.3.3 例文精读3

第二天:DID模型扩展与交叠DID

课时4PSM-DID与模糊DID 

·4.1 PSM-DID方法详解

o4.1.1  PSM的基本概念与目的 

o4.1.2  PSM在解决选择偏差中的作用

o4.1.3  PSM的假设条件与共同支持检验 

·4.2 PSM-DID例文精读与扩展模型

o4.2.1 经典PSM-DID案例深度剖析

o4.2.2 时变处理效应与持续期的灵活处理

o4.2.3 多期面板数据下的PSM-DID实现

· 4.3 异质性处理效应与模糊DID

o4.3.1  模糊DID估计的理论与实现

o4.3.2  异质性处理效应下的双向固定效应稳健性评估

o4.3.3 例文精读1

课时5:空间DID

·5.1 空间DID概述与模型构建

o5.1.1  空间DID的基本假设与适用场景

o5.1.2 空间DID模型构建

·5.2 政策评估的空间效应分解与稳健估计

o5.2.1 政策评估的空间效应分解

o 5.2.2 存在溢出处理效应时的稳健DID估计

·5.3 空间DID例文精读

o5.3空间DID例文精读与实践操作

o5.3.1 例文精读3篇,分析空间DID的应用与解读

o5.3.2 实践操作:使用Stata进行空间DID模型的构建与分析

课时6:交叠DIDDID与合成控制的结合

·6.1 交叠DID应用建议与分解

o6.1.1 交叠DID应用建议与实际案例分析

o6.1.2 交叠DID分解方法与步骤

o6.1.3 文献解读2篇,深入探讨交叠DID的应用

·6.2 三类交叠DID的异质稳健估计

o6.2.1 组别-时期平均处理效应的计算与解释

o6.2.2 插补估计量的原理与应用

o6.2.3 堆叠回归估计量的实现与比较

·6.3 DID与合成控制的结合:合成DID

o6.3.1 合成DID的原理与优势

o6.3.2 使用Stata进行合成DID模型的构建与分析

o6.3.3 实践操作:结合DID与合成控制方法进行政策评估


[课程07] 轻松搞定毕业论文!零基础掌握Stata实战和CHARLS数据库处理

课程内容(课程售价499元)


图片


我们开设的 CHARLS 数据库课程已开售一年。CHARLS 数据库作为国内广受欢迎的公共健康数据库之一,每年发文量上千篇,涵盖诸多研究领域。我们由衷地希望这门课程能够对学员的科研工作有所帮助,因此课程资料也在逐步更新。本次课程资料结合最新的文献进展,纳入了一些新的变量,学员可在群里自行下载使用。本次数据更新主要新增变量:
  • 童年逆境 ACE 指数
  • 社会隔离(Social isolation)
  • 死亡时间
  • 慢性病患病时间
  • 前列腺疾病以及绝经问题
  • WHTR(腰围身高比)/VAI(内脏脂肪指数)/ABSI(体型指)/BRI(身体圆形指数)/LAP(脂质累积指数)/CI(圆锥指数)/CVAI(中国内脏脂肪指数) /TyG(甘油三酯葡萄糖指数)/ WWI / TyG-WWI / 累积TyG-WWI /TyG_BMI /TyG_WC /TyG_WHtR /eGDR /AIP/RC/RCII/累积RCII /累积RC /累积CRP /CHR(C反应蛋白与高密度脂蛋白胆固醇的比值)/累积CHR / NHHR(非高密度脂蛋白胆固醇与高密度脂蛋白胆固醇的比值)/ CMM(心脏代谢共病)/ MCR(运动-认知风险综合征)等医学变量
  • 子女收入(适用于衡量家庭收入或者共同富裕问题)
  • 更多常用变量不再详细赘述..........
之前数据主要变量:
  • 2011年至2020年实证研究中常用变量(如年龄、性别、婚姻、教育程度、户籍、家庭收入、家庭消费、家庭规模、健在子女数量、吸烟、饮酒、身体活动、自评健康、14种慢性病、ADL、IADL、认知能力、情景记忆、心智状况、生活满意度、CESD-10、医疗保险、养老保险、代际支持等)的CHARLS数据和处理代码,供学员学习、模仿和修改使用。

  • 血检指标,包括:是否空腹、白细胞、平均红细胞体积、血小板计数、尿素氮、血糖、肌酐、总胆固醇、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、C反应蛋白、糖化血红蛋白、尿酸、红细胞比容、血红蛋白、胱抑素C 、步行速度测试、收缩压、舒张压、脉搏、握力测试、身高、体重、腰围、甘油三酯葡萄糖指数(TyG指数)油三酯葡萄糖体重指数(TyG-BMI指数)

  • 其他:虚弱指数MetS代谢综合征 CircS昼夜节律综合症慢性病患病年份、是否死亡、死亡年份、肌少症、老年人跌倒等等!

    【数据展示】

  • 图片
    图片




[课程06]基于双重机器学习的前沿因果推断

课程内容(课程售价799元)


第一天:软件基础与核心方法 

上午:软件入门与双重机器学习基础 

1. **Python Stata因果推断分析入门**

- Python科学计算环境配置

关键Python库介绍(参考:Microsoft Research, 2023, EconML文档)

- Stata基础因果分析命令回顾(参考:StataCorp, 2023, dml命令手册)

两种软件的数据交互方法

实操练习:用两种软件运行相同的OLS回归

 

2. **双重机器学习介绍**

传统计量方法的局限(参考:Angrist & Pischke, 2009

机器学习在因果推断中的潜力(参考:Hastie et al., 2017

双重机器学习基本框架(参考:Chernozhukov et al., 2018

- Neyman正交性与去偏机制

- PythonStata实现对比

 

3. **双重机器学习的软件实现框架**

- Python实现:EconMLDoubleML库(参考:Bach et al., 2022

- Stata实现:dml命令与插件

数据预处理最佳实践

交互演示:两种软件实现同一DML模型

 

下午:方法比较与代码复现

 

1. **基于机器学习的因果推断方法比较**

双重机器学习vs传统方法(参考:Knaus et al., 2021

不同机器学习方法比较

- Python vs Stata实现效率对比

可视化与结果报告

 

2. **代码复现(1):跨软件实现**

- Python复现:EconML实现基础 DML(参考:Chernozhukov et al., 2018代码库)

- Stata复现:dml命令实现相同分析

结果对比与诊断

交互练习:软件选择实践

 

第二天:案例研究与高级应用

 

第二天:案例研究与高级应用(新增中文案例)

上午:案例研究I - 政策与企业行为

1.跨境电商综合试验区政策对绿色技术创新的影响

o研究问题与数据介绍(参考:蒋金荷 & 黄珊, 2024

o双重机器学习实现步骤

o结果分析与政策启示

oPythonStata实现对比

2.银行监管处罚对企业创新的影响

o研究设计回顾(参考:魏建等, 2024

o异质性处理效应分析

o稳健性检验与机制讨论

 

下午:案例研究II - 区域发展与数据要素

1.公共数据开放对城市创业活力的影响

o研究问题与数据介绍(参考:蔡运坤等, 2024

o双重机器学习应用

o结果可视化与政策建议

2. 网络基础设施对包容性绿色增长的影响

o复现分析(参考:张涛 & 李均超, 2023

o因果效应估计与地区差距讨论

o双重机器学习的优势总结

3.综合实践与未来方向

o完整分析流程演练

o分组讨论:中文案例的扩展应用

o开放问题与最新研究进展

 

部分参考文献【中文顶刊】


[11]蒋金荷,黄珊.贸易新业态对绿色技术创新的影响研究——来自跨境电商综合试验区政策的证据[J].数量经济技术经济研究,2024,41(12):133-154

[12]张科,熊子怡.法律制度完善、跨区域合作与省际边界地区绿色发展——来自《旅游法》实施的准自然实验[J].数量经济技术经济研究,2024,41(12):47-67

[13]魏建,薛启航,王慧敏,姚笛.银行监管处罚如何影响企业创新[J].中国工业经济,2024(7):105-123

[14]蔡运坤,周京奎,袁旺平. 数据要素共享与城市创业活力——来自公共数据开放的经验证据[J].数量经济技术经济研究,2024,41(8):5-25

[15]张涛,李均超.网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断[J].数量经济技术经济研究,2023,40(4):113-135



【课程07】零基础学空间计量经济学及Stata应用

第一讲:空间计量经济学基础与Stata入门(1课时)

1.空间计量经济学概述

o定义、发展历程及学科重要性。

o核心概念:空间依赖性、空间异质性、空间权重矩阵。

2.Stata 基础操作

o软件安装与界面介绍。

o数据导入、清洗与管理(do文件、log文件使用)。

第二讲:空间权重矩阵理论与实操(1课时)

1.空间权重矩阵类型与构建

o邻接矩阵、地理距离矩阵、经济地理矩阵(5种类型)。

o门槛矩阵与引力模型矩阵(附Stata命令)。

2.实操演示

o使用Stata生成并标准化空间权重矩阵。

第三讲:截面空间计量模型(2课时)

1.模型检验与选择

o空间自相关检验(Moran's ILM检验、LR检验)。

o模型比较:SARSEM SDMSACGNS

2.Stata实操与结果解读

o估计SAR/SEM/SDM模型,导出结果并分析。

o结合文献案例(如失业率、政策扩散研究)。

第四讲:面板空间计量模型(1课时)

1.面板模型估计

o静态模型:PSLM(空间滞后)、PSEM(空间误差)。

o动态空间面板模型简介。

2.结果解读与常见问题

o固定效应 vs 随机效应,Hausman检验。




第二天(5课时)

第五讲:高级模型与应用(2课时)

1.空间杜宾模型(SDM

o原理、Stata实现及结果解释。

2.空间收敛模型

o理论背景与Stata操作(β收敛、σ收敛)。

3.空间溢出效应可视化

o绘制系数置信区间图(Stata命令)。

第六讲:ArcGIS与空间数据可视化(1课时)

1.地图绘制实战

o地级市地图(含边界线)、区域地图(长三角/珠三角)。

o空间矩阵可视化(StataArcGIS联动)。

第七讲:论文复现与稳健性检验(1课时)

1.经典文献复现

o(1) Jean Dubéand Diego Legros. Spatial econometrics and spatial data pooled over time:towards an adapted modeling approach. Journal of Real Estate Literature,22(1):103125, 2014.

o(2) Kondo K .Spatial persistence of Japanese unemployment rates[J]. Japan & the WorldEconomy, 2015,36:113-122.

o(3) Scott JCook et al. Beyond Policy Diffusion: Spatial Econometric Models of PublicAdministration, Journal of Public Administration Research and Theory, muy050.

o(4) Williams LK , Seki K , Whitten G D . Youve Got Some Explaining To Do The Influence ofEconomic Conditions and Spatial Competition on Party Strategy[J]. PoliticalScience Research and Methods, 2016,4(01):47-63.

o(5) Whitten GD, Williams L K, Wimpy C. Interpretation: the final spatial frontier[J].Political Science Research and Methods, 2017:1-17.

第八讲:总结与答疑(1课时)

1.课程回顾

o关键知识点梳理(从理论到Stata全流程)。

2.常见问题解答

o模型选择、结果解读、命令报错处理。




课程特色

·零基础友好:从理论到代码逐步教学。

·实战导向:覆盖 90%空间计量模型(截面/面板/动态)。

·工具链完整Stata+ArcGIS全流程,附赠自定义命令。

·文献复现5篇顶刊论文逐行解读,助力学术写作。



【课程09】七大老年健康数据库挖掘课程!
课程内容(课程售价999元)

跨国老年健康公共数据库的开放共享为科研人员提供了“弯道超车”的黄金机会。这些数据库覆盖33个国家,积累数十年追踪数据,支持多维度、跨文化研究已成为顶刊SCI的“高产田”

图片

🔥零基础友好,手把手教学 

真正零基础,由浅入深,集中式培训、循序渐进,全面提升你的研究能力。丰富的案例分析与实战演练,确保你能够学以致用。从零到一的“SCI加速器”,数据处理分析“一站式”解决方案


📚全流程实战,覆盖科研全周期
方法学实战,案例驱动手把手复现文章分析路径。通过实际案例分析和数据挖掘练习,帮助您将理论知识转化为实践技能,快速上手数据库操作。

💪课后持续赋能,视频资源终身享 

加入专属学习群、课程永久回放+课程群答疑+1到2周1次统计问题直播答疑,答疑时限1年,课程结束后,确保学习效果,帮助学员提升!


📊全套课程材料赠送 

全套资料免费赠送,包括课程PPT和“本课程”所需要的相关数据代码及软件!


💻系统学习,数据库信息轻松掌握
7库纵向数据申请全流程拆解,将逐一介绍七大数据库的背景、数据结构、变量定义及应用场景,让您全面掌握每个数据库的独特之处。
【课程10】从零基础掌握Python机器学习与深度学习

第一模块 Python基础知识串讲(4课时)

1、Python编程环境搭建(Anaconda安装Python之Hello World;第三方模块的安装与使用)

2、Python基本语法(Python变量命名规则;Python基本数学运算;Python常用变量类型的定义与操作;Python程序注释)

3、Python流程控制(条件判断;for循环;while循环;break和continue关键字;嵌套循环与可变循环)

4、Python函数与对象(函数的定义与调用;函数的参数传递与返回值;变量作用域与全局变量;对象的创建与使用)

第二模块 Python科学计算(4课时)

1Matplotlib的安装与图形绘制(数据可视化设计美学、Matplotlib常用函数简介与使用、设置散点、线条、坐标轴、图例、注解等属性;绘制多图;图的嵌套)

2、科学计算模块库(Numpy常用函数简介与使用;Pandas常用函数简介与使用;Scipy常用函数简介与使用

3、实操练习

三模块Python统计分析与可视化 4课时)

1、统计学基础知识概述(描述统计、统计推断、时空统计)

2、统计数据的描述与可视化(数据的描述性统计:均值、中位数、众数、方差、标准差、极差、四分位数间距等;条形图、直方图、散点图、箱线图等)

3、概率分布与统计推断(离散概率分布:二项分布、泊松分布;连续概率分布:正态分布、均匀分布、指数分布;点估计与区间估计;最大似然估计与贝叶斯估计;假设检验:t检验、卡方检验、F检验;P值与显著性水平等)

4、回归分析(多元线性回归模型;最小二乘法估计;变量选择与模型优化;多重共线性与解决方法;Ridge回归;LASSO回归;ElasticNet回归等)

5、实操练习

四模块Python树模型(4课时)

1、机器学习概述、数据预测与预测建模

2、决策树模型(认识树模型;什么是信息熵和信息增益?ID3算法和C4.5算法的区别与联系);决策树除了建模型之外,还可以帮我们做什么事情?

3、随机森林模型(为什么需要随机森林算法?广义与狭义意义下的“随机森林”分别指的是什么?“随机”体现在哪些地方?随机森林的本质是什么?怎样可视化、解读随机森林的结果?)

4、Bagging与Boosting的区别与联系

5AdaBoost vs. Gradient Boosting的工作原理

6、常用的GBDT算法框架(XGBoost、LightGBM)

7、SHAP法解释特征重要性与可视化(Shapley值的定义与计算方法、SHAP值的可视化与特征重要性解释)

8、部分依赖分析(部分依赖分析的原理、单变量影响分析、双变量交互分析)

9、实操练习

第五模块 因果推断与因果学习(4课时)

1、因果推断概述

2、因果推断范式(潜在因果推断、结构因果推断)

3、因果推断实现(传统方法、机器学习方法)

4、因果机制识别与发现(因果效应估计、非线性因果效应估计、因果作用未来预测)

5、时空因果推断(时空统计概述、时空因果推断、时空因果实现)

6、实操练习

第六模块 Python深度学习(6课时)

1、人工神经网络(人工神经网络概念、底层原理)

2、深度学习模型原理(人工神经网络基础、卷积神经网络、生成对抗神经网络、自编码技术、循环神经网络)

3、深度学习模型实现

4、案例演示与实操

第七模块 典型论文讲解与研究设计复现、答疑与交流(2课时)

1、树模型案例分析与实现

2、深度学习模型案例分析与实现

3、因果学习案例分析与实现

4、课程相关资料拷贝与分享

5、答疑与讨论(大家提前把问题整理好)



[课程11]社会科学中的因果推断(视频版)

1、线性和非线性回归模型(2h)

  • 1.1 控制变量选择(前期),什么是好控制变量和坏控制变量?

  • 1.2 不同回归模型的选择和适用场景。

  • 1.3 普通最小二乘法(OLS)以及怎么在 Stata 中实现和解读?

  • 1.4 二元选择模型(Probit、Logit)以及怎么在 Stata 中实现和解读?

  • 1.5 多元选择模型(Mlogit)以及怎么在 Stata 中实现和解读?

  • 1.6 条件选择模型(Clogit)以及怎么在 Stata 中实现和解读?

  • 1.7 岭回归和Lasso回归怎么在 Stata 中实现和解读?

  • 1.8 四个回归命令(reg、xtreg、areg、reghdfe)之间的关系,以及reghdfe潜在的优势。

  • 1.9 在高维固定效应情况下,线性模型和非线性模型的选择。

  • 1.10 线性-线性、半对数、对数-对数回归模型估计系数的经济解释。

  • 1.11 异方差稳健标准误以及聚类稳健标准误的选取,以及在不同回归命令下的联系和区别。

  • 1.12 潜在的模型设定问题和内生性问题。

2、匹配法(Matching)(1.5h)

  • 2.1 为什么使用匹配法?

  • 2.2 匹配法的优势和潜在误用。

  • 2.3 匹配变量的正确选取。

  • 2.4 倾向性匹配法(PSM)以及怎么在 Stata 中实现和解读?

  • 2.5 逆概率加权法(IPW)以及怎么在 Stata 中实现和解读?

  • 2.6 双重稳健估计(Double Robust Estimator,DRE)以及怎么在 Stata 中实现和解读?

  • 2.7 广义精确匹配(CEM)以及怎么在 Stata 中实现和解读?

  • 2.8 匹配法文章复现以及类似文章的详解。

3、工具变量法(IV)(2h)

  • 3.1 为什么使用工具变量法?

  • 3.2 工具变量法的识别假设。

  • 3.3 工具变量怎么选取?

  • 3.4 工具变量的结果怎么解读?

  • 3.5 怎么说明工具变量的有效性?

  • 3.6 怎么考虑工具变量的排他性约束假设?

  • 3.7 线性工具变量怎么在 Stata 中实现以及解读?

  • 3.8 非线性工具变量详解(IV-Probit、IV-Tobit),以及怎么在 Stata 中正确估计偏效应。

  • 3.9 在没有合适的工具变量前提下,怎么构造工具变量(Bartik、Granular、Lewbel)?

  • 3.10 异质性处理效应(Local Average Treatment Effects,LATE;Marginal Treatment Effects,MTE)。

  • 3.11 工具变量文章复现以及类似文章的详解。

  • 3.12 赫克曼(Heckman)两步法和处理效应模型(TEM)详解和区别。

4、双重差分方法(DID)(3h)

  • 4.1 双重差分法的识别假设。

  • 4.2 前定控制变量的选取以及非时变控制变量的处理。

  • 4.3 经典DID方法(2×2)以及怎么在 Stata 中实现和解读?

  • 4.4 匹配法和经典DID的结合(PSM-DID、IPW-DID)。

  • 4.5 经典DID文章复现以及类似文章的详解。

  • 4.6 强度/连续(Generalized)DID方法以及怎么在 Stata 中实现和解读?

  • 4.7 强度DID文章复现以及类似文章的详解。

  • 4.8 队列(Cohort)DID方法以及怎么在 Stata 中实现和解读?

  • 4.9 队列DID文章复现以及类似文章的详解。

  • 4.10 三重差分方法(DDD)和DID-IV方法。

  • 4.11 交错/交叠(Staggered)DID方法基本识别假设条件的讨论。

  • 4.12 培根(Goodman-Bacon)分解以及负权重来源。

  • 4.13 异质性稳健估计量(csdid、did_imputation、did_multiplegt、eventstudyinteract)详解。

  • 4.14 其他常见异质性稳健估计量基本解读。

  • 4.15 事件研究法(Event Study)或动态双重差分法(Dynamic DID)。

  • 4.16 在一张图中绘制不同的异质性稳健DID估计量。

  • 4.17 进入退出型DID的解决方案以及怎么在 Stata 中实现?

5、其他常见因果推断方法(2h)

  • 5.1 回归断点设计(RDD)的识别假设、惯用操作以及怎么在 Stata 中实现?

  • 5.2 回归断点设计文章复现以及类似文章的详解。

  • 5.3 合成控制法(SCM)的适用条件以及怎么在 Stata 中实现?

  • 5.4 遗漏变量敏感性分析(Altonji et al.、Bellows and Miguel、0ster、Cinelli and Hazlett)怎么在STATA中实现?

  • 5.5 双重机器学习(DML)怎么在 Stata 中实现?

  • 5.6 双重机器学习文章复现以及类似文章的详解。

6、中介效应和调节效应分析(2h)

  • 6.1 什么是中介效应以及中介效应在机制分析中的适用场景。

  • 6.2 什么是调节效应以及调节效应在机制分析中的适用场景。

  • 6.3 三步法的基本检验以及怎么在 Stata 中实现?

  • 6.4 三步法在机制分析中潜在的问题(bad control)。

  • 6.5 因果中介效应以及怎么在 Stata 中实现?

  • 6.6 因果中介效应的敏感性分析以及怎么在 Stata 中实现?

  • 6.7 中介效应的规范操作。

  • 6.8 “赛马效应(horse race)”在机制分析中的作用。

  • 6.9 在调节效应分析中好调节变量的选取。

  • 6.10 调节效应怎么强化因果关系?

  • 6.11 调节效应在机制分析中的理论逻辑。

  • 6.12 分组回归和交互项回归的区别。

  • 6.13 分组回归中组间系数差异检验(bdiff)以及怎么在 Stata 中实现?

  • 6.14 分组回归中组间系数差异检验简单计算方法(Fan et al.,2021,AEJ)

  • 6.15 交互项回归中主系数不显著但有趣的解释。

  • 6.16 调节效应去中心化的误用和正确理解。

  • 6.17 规范的中介效应和调节效应怎么在 Stata 中实现?

7、如何快速完成一篇实证论文的经验之谈(2h)

  • 包括但不限于论文主题、数据库的选取、代码程序、方法应用、实证结果展示、论文撰写等等


【课程12】如何利用ChatGPT4撰写标书与科研论文

【课程13】零基础到高手:成为优秀的质性研究者

整体课程分为4大部分模块,如下:

【质性研究的基础模块】

授课方法;课件+案例分析

-质性研究的方法学概况

-质性方法的哲学基础

-质性研究适合的研究问题选择

-质性研究的基本逻辑与流程

-质性方法的抽样

-质性数据搜集的方法

-研究选题的技巧

-质性研究方法的方法群及类型

-质性研究的设计方法

-访谈方法的技术与实操

-研究中的反身性实施

-质性研究的案例复刻与拓展

-数据分析的基本策略

-质性研究的质量评估方法

-其他各类质性研究的关键要点

【质性研究的主流方法学模块】

授课方法:课件+案例分析

主题分析法

-主题分析法的介绍与适用

-主题分析法的实操流程

- 主题分析法的研究案例拆解

扎根理论

-扎根理论的介绍与适用

-三类扎根理论的实操流程

-扎根理论的研究案例拆解

现象学分析方法

-现象学方法的介绍与适用

-描述现象学与解释现象学的实操流程

-现象学分析的研究案例拆解

以质性为主的混合研究方法策略

-混合研究方法的类型解析

-多类型研究方法的组合(研究案例)

【质性研究的工具使用模块】

授课方式:软件操作手册+成套MAXQDA书籍+案例实操

-Maxqda质性工具的功能介绍

-质性文本的编程策略

-借助MaxQDA的编码实操

-借助AI实施质性研究的方法策略

-各类辅助研究工具的介绍(转录、文本挖掘等)

【质性研究论文撰写模块】

授课方式:案例分析+互动式研讨

-质性方法的学术论文模式

-质性论文的框架解构

- 经典质性文献的案例拆解


讲授/答疑老师:
上海高校教授,博士,在CSSCI、SSCI、ESCI、北大中文国内外核心期刊上,公开发表论文近40篇,多篇被人大复印资料转载、转摘。公开出版专著2本,参编著作6本。多份决咨报告获省部级领导批示或部门采纳。专注于社会研究方法与技术研究,擅长于各类质性、量化与混合研究方法及工具运用。个人小红书(慧研格真)、B站(慧研格真)的研究方法、学术研究与写作类视频,有百万播放量。


报名:倘若您对课程感兴趣,扫描下方二维码联系购买,
可开培训费、资料费、技术服务费、信息服务费等,可公对公转账,提供培训通知。请扫描下方二维码可添加助教微信询问课程详情及发票事宜。
 图片    
       助教二维码,联系咨询       

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189372