周日腾讯直播其他时间练习和群内答疑
第一节R语言基础
(周日9:00-11:30)
1.1,
R语言基本理论,
1.2, R语言简介与环境搭建
1.3, R语言快速入门
1.4,
数据结构与数据类型
1.5, 数据导入与导出
1.6, 数据清洗与预处理
1.7, 基础统计与可视化
1.8, 统计分析与建模入门
第二节CHARLS数据库(一)
(周日14
:00-16:30)
2.1, CHARLS数据库概述
2.2, 数据申请与权限管理
2.
3, 数据结构与变量解读
2.4, 数据下载与格式转换
2.5, R环境配置
2.6
, 数据导入与初步探索
2.7, 数据清洗实战
2.8, 变量重编码与衍生变量
第三节CHARLS
数据库(二)
(周日9:00-11:30)
3.1, 复杂抽样设计处理
3.2, 横断面数据分析
3.3, 健康经济学分析案例
3.4, 可视化呈现
3.5, SCI论文写作指导
3.
6, 常见错误与解决方案
第四节nhanes数据库(一)
(周日14
:00-16:30)
4.1, NHANES数据库概述
4.2, 数据获取与下载
4.
3, 数据结构与变量解读
4.4, 数据权限与伦理合规
4.5, 数据导入与预处理
4.6,
数据清洗
4.7, 变量衍生与标准化
第五节nhanes数据库(二)
(周日9:00-11:30)
5.1, 横断面分析案例
5.2, 时间趋势分析
5.3,
生物标志物与疾病关联
5.4, 可视化呈现
5.5, 膳食与营养分析
5.6, 审稿人常见问题应对
第六节孟德尔随机化(一)
(周日14:00-16:30)
6.1, 孟德尔随机化原理与基础
6.2, 适用场景与科学问题设计
6.3, 数据来源与工具变量获取
6.
4, 数据预处理与 harmonization
6.5, 工具变量强度评估
6.6, 基础MR分析方法
第七节孟德尔随机化(二)
(周日9:00-11:30)
7.1, 异质性检验与处理
7.2, 水平多效性检测
7.3, 双向孟德尔随机化
7.4, 药物靶点MR(Drug Target MR)
7.5, 结果可视化
第八节Geo数据库(一)
(周日14:00-16:30)
8.1, GEO数据库概述
8.2, 数据检索与筛选策略
8.3, 原始数据下载与格式解析
8.4, 数据预处理
8.5, 差异表达分析(DEGs筛选)
8.6, 蛋白互作网络构建
8.7, 功能富集分析(GO/KEGG)
第九节
Geo数据库(二)
(周日9:00-11:30)
9.1, GSEA分析
9.2, GSVA
分析
9.3, 机器学习与生物标志物筛选
9.4, 免疫浸润
9.5, 单细胞GEO
数据分析入门
9.6, 单细胞数据下载于筛选
9.7, PCA分析,高变基因的筛选
9.8, UMAP和
TSNE降维处理
9.9, 细胞注释
9.10, 基因差异表达分析
第十节
机器学习
(周日14:00-16:30)
10.1,机器学习基础概念与算法分类
10.2,数据预处理与特征工程实战
10.3,监督学习模型构建与优化
10.4
,无监督学习与聚类分析应用
10.5,模型评估与性能提升策略
10.6,深度学习入门与神经网络基础
第十一节
多数据库联合分析(一)
(周日9:00-11:30)
11.1, 多数据库联合分析的科学价值:
解决单一数据库样本量不足问题(
CHARLS+NHANES)
组学机制(GEO)与流行病学证据(CHARLS/NHANES)的整合
孟德尔随机化(MR)补充因果推断
11.2,研究设计与科学问题定位
跨数据库的假设构建(如“
环境因素→基因表达→疾病结局”)
确定核心变量(如CHARLS/NHANES的暴露变量、GEO的差异基因、MR的工具变量)
11.3,数据获取与权限管理
CHARLS/NHANES的申请流程与伦理审查
GEO数据集筛选标准(GSE编号、样本量、平台一致性)
公开GWAS数据库(IEU OpenGWAS、UK Biobank)的使用
11.4,CHARLS/NHANES
流行病学分析
统一编码(如BMI分类:WHO标准vs, 中国标准)
跨数据库ID匹配(如ICD编码与基因Symbol的转换)
11.5,多组学数据整合
复杂抽样设计处理(NHANES权重变量应用)
横断面分析
11.6,跨人群一致性检验
比较中美人群结果差异(CHARLS vs, NHANES
)
第十二节多数据库联合分析(二)
(周日14:00-16:30)
12.1,可视化策略
联合结果森林图(流行病学+MR效应值)
12.2, 统计方法进阶
中介分析(环境暴露→基因表达→疾病)
机器学习
BKMR等模型
12.3, 论文写作框架
方法学描述模板(多数据库整合段落)
结果分模块呈现(流行病学+组学+MR)
12.
4, 期刊选择与投稿技巧
推荐期刊(如《BMC Medicine》《EBioMedicine》)
应对审稿人对数据融合的质疑
12.5, 完整复现一篇“多数据库联合分析”
的高分论文