理解⼀种疾病的某种现象仅使用⼀种数据类型是远远不够的,随着高通量测序和多组学的快速发展,生物医学研究开始采取多组学技术结合的方法,传统的信息数据处理算法不能满足大数据的处理要求,机器学习作为从数据中进7学习的算法,可以对不同组学来源(如基因组学、转录组学、蛋白质组学、代谢组学)的数据进行综合分析,开发针对个体多样性的多因素预测模型,可以显著减少需要考虑的潜在治疗组合的空间,并识别其他可能被忽视的组合,并可以添加实验验证的步骤,以提供额外的证据,从而证明预测治疗可能存在的有效性。
机器学习在疾病亚型识别、生物标志物发现、通路分析以及药物发现及其再利用有着更广泛的前景和应用空间。然而,机器学习的应用仍存在一些瓶颈,人工智能研究项目所需的技能和知识匮乏缺失制约着该方向的发展。
本次系列课程培训主办方为北京软研国际信息技术研究院,由互动派(北京)教育科技有限公司具体承办,具体通知如下:
1、本次课程共5天,每天六个学时,共30个学时,采用“3+2”教学体系,分两阶段授课,给与学员巩固练习时间;采用在线直播的形式,培训结束提供无限次回放视频,发送全部案例资料,建立永不解散的课程群,长期互动答疑。2、课程入门阶段从机器学习以及机器学习在多组学数据分析及应用基本概念开始讲授,让大家明确机器学习方法的适用性和优势,以及有针对性的对python语言基础进行系统学习,为之后构建相应算法模型框架打下基础。3、课程进阶阶段分别讲授深度学习神经网络、经典机器学习模型、多组学联合分析-阐明疾病分子机制、深度学习在组学数据的应用、机器学习+Science五个模块,结合案例实践教学(COVID-19中生物标志物的发现、阿尔茨海默疾病潜在药物靶点筛选、精神障碍人群队列特征、多组学分析胃癌和解析胃癌肿瘤标志物、转录组学的去批次效应、肿瘤的分级预测、多组学构建肝癌患者分型的新算法、神经网络自编码器算法在多组学中的应用、乳腺肿瘤分类模型及评估等)4、课程通过基础入门+进阶实例演练的讲授思路,从初学及应用研究角度出发,带大家实战演练机器学习在多组学整合分析中的数据处理、预测模型以及生物学意义阐述等,助力大家掌握多种机器学习算法模型的构建以及在多组学联合分析在肿瘤及慢性病中的实际应用,并介绍当下深度学习算法高维组学数据处理,生物网络挖掘的前沿方法,有助于研究创新机器学习算法解决生物学及临床疾病问题与需求。


集成多组学数据的机器学习在生物医学中的应用
2022年07月15日-07月17日
在线直播(授课三天)
2022年07月23日-07月24日
在线直播(授课两天)
“集成多组学数据的机器学习在生物医学中的应用”
7月15日 上午 | 机器学习 导论 | 学习目标:对机器学习基本概念进行介绍,让大家对机器学习基本概念有大致了解。明确机器学习方法的适用性,优势,以及局限性等 |
|
python 语言基础 | 学习目标:机器学习主流实现是python语言。学习机器学习之前,有针对性的对python进行系统的学习,以方便将来开展机器学习的学习 |
python安装与开发环境的搭建 基本数据类型、组合数据类型 函数、列表 、元组、字典、集合 控制结构、循环结构 Numpy模块——矩阵的科学计算 Matplotlib模块——数据处理与绘图 Pandas模块——csv数据处理与分析 Sklearn模块——机器学习模型基础软件包调用
|
7月15日
下午 | 深度学习 神经网络 | 学习目标:从零开始手动实现一个神经网络,在这一过程中对所涉及的原理进行系统讲解及实践,让大家能够更深刻的理解算法背后的原理以及实现方法,之后有利于对其他机器学习更全面快速掌握 |
logistic 回归与损失函数 梯度下降法与导数 计算图的导数计算 logistic 回归中的梯度下降法 向量化 logistic 回归的梯度输出 神经网络的梯度下降法 深层网络中的前向传播 深度学习框架——Pytorch的使用
案例实践教学一:神经网络在COVID-19中生物标志物的发现研究 |
7月16日
|
经典机器学习及多组学应用
| 学习目标:对在多组学整合分析中最常使用的几种机器学习模型进行介绍,总结它们的优缺点及适用范围,通过动手实践快速掌握几种方法 |
线性模型(线性回归、梯度下降、正则化、回归的评价指标) 决策树(决策树原理、ID3算法、C4.5算法、CART算法) 支持向量机(线性支持向量机、可分支持向量机、不可分支持向量机) 集成学习(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法) 模型选择与性能优化(数据清洗、特征工程、数据建模) Scikit-learn机器学习库的使用
案例实践教学二:利用随机森林方法筛选阿尔茨海默疾病的潜在药物靶点--以单细胞转录组学数据为例 案例实践教学三:利用集成学习联合蛋白组学-代谢组学分析精神障碍人群队列特征 |
7月17日
|
多组学联合分析与疾病分子机制 | 学习背景:研究影响疾病表型变化影响的因素包括DNA,RNA,蛋白质和代谢物等。单一组学的数据难以系统全面地解析复杂生理过程的调控机制,多组学联合分析通过对来自基因组、转录组、蛋白组、代谢组和脂质组等不同生物分子层次的批量数据进行归一化处理、比较分析和相关性分析等统计学分析,建立不同层次分子间的数据关系,从而共同探究生物体内潜在的调控网络机制,为生物体作用机制提供了更多证据。 学习目标:从常见的多组学联合分析策略出发,如转录组+代谢组,蛋白组+代谢组等,对常用的数理统计分析方法进行介绍,之后学习如何利用数据库如KEGG等进行生物功能富集分析,结合机器学习方法进行生物标志物的挖掘,疾病预测以及生物分子作用机制等。 |
常用生物组学实验与分析方法,如转录组学,代谢组学 常用组学数据库介绍,如TCGA,PathBank,HMDB,KEGG Python批量处理组学数据,归一化处理,差异分析,相关性分析 生物功能分析:GO 功能分析、代谢通路富集、分子互作等 基于转录组学的差异基因筛选,疾病预测 基于差异基因,联合代谢组学分析疾病分子发生机制
案例实践教学四:(包含以下内容) 转录组+代谢组的多组学分析胃癌 从海量的数据中筛选出关键基因、代谢物及代谢通路
深度解析胃癌肿瘤标志物 |
7月23日
| 深度学习在多组学数据中的应用 | 学习目标:随着高通量组学平台的发展,生物医学研究大多采取了多组学技术结合的方法,不同组学来源(如转录组学、蛋白质组学和代谢组学)的数据可以通过基于深度学习的预测算法进行整合,以揭示系统生物学的复杂工作。在这一部分我们会重点对基于深度学习的神经网络进行系统的讲解,学习常见的神经网络架构在多组学分析的应用。 |
案例实践教学五:利用变分自编码模型实现转录组学的去批次效应 案例实践教学六:利用卷积神经网络实现对肿瘤的分级预测 |
7月24日
|
机器学习+Science
| 学习目标:人工智能领域前沿内容,让大家了解最新的多组学与机器学习领域的研究动态,同时介绍几种更为先进的机器学习算法。 |
强化学习在多组学数据联合分析中的应用 多组学数据库在生物信息网络的挖掘与应用 生成模型在多组学数据的应用与挑战 影像组学介绍,以计算机视觉算法进行疾病诊断
案例实践教学七:基于多组学构建肝癌患者分型的新算法 案例实践教学八:神经网络自编码器算法在蛋白组学+代谢组学应用 案例实践教学九:基于深度学习特征的乳腺肿瘤分类模型评估 |
部分案例图示:


基于GWAS-表型组学的肺癌风险因子研究



基于图神经网络的代谢物分子性质预测与鉴定
基于自编码器的单细胞转录组-蛋白组学整合分析
(含报名费、培训费、资料费)
集成多组学数据专题:每人¥4600元
费用提供用于报销正规机打发票及盖有公章的纸质通知文件;如需开具会议费的单位请联系招生老师要会议邀请函;
1、凡报名学员将获得本次培训书本教材及全部案例随堂电子资料;
2、培训结束可获得所学专题课程全部无限次回放视频;优惠一:2022年6月24日前报名汇款可享受400元优惠(仅限前八名);
优惠二:老客户参加或者推荐学员可享受额外优惠(具体请咨询招生联系人);4、学员提出的各自遇到的问题,课程结束后可以长期得到老师的解答与指导;
5、课程结束后可获得:北京软研国际信息技术研究院培训中心颁发的《机器学习多组学与生物医学应用工程师》专业技能结业证书;

如何报名、缴费?
2.缴费支持公对公转账、个人垫付(对公到账及时退还垫付费用,可开具垫付证明)


