Python社区  »  机器学习算法

专场介绍 | 第12届中国R会议(北京)机器学习应用专场

统计之都 • 3 月前 • 42 次点击  

本次会议由统计之都主办,中国人民大学统计学院、中国人民大学应用统计科学研究中心、狗熊会协办,并得到 RStudio、人民邮电出版社、图灵教育、中国人民大学出版社的赞助支持以及 IT 大咖说独家视频支持。本届会议涵盖了多个学科领域,我们真诚地期待您的到来,一同感受数据科学为这个时代带来的惊喜与挑战。


参会报名正在进行,欢迎点击文末“阅读原文”报名参会!


下面为您奉上本次R会机器学习应用专场演讲介绍:

机器学习应用专场


01

涂富艺

基于Unet的直肠肿瘤识别


个人简介

中国人民大学博士在读,研究方向为实验设计。


报告摘要

就肿瘤本身而言,其可以出现在直肠的任何地方,可能有任何形状、 大小和对比度。这些原因促使我们探索一种机器学习解决方案,利用一个灵活的,高容量的,同时是非常有效的深度神经网络(DNN)来实现全自动的直肠肿瘤分割。然而,DNN 的成功训练往往需要数千个带标签的培训样本,受数据量的限制,我们进一步采用基于 U-Net 的直肠肿瘤分割算法,并通过抽取感兴趣区域(ROI)中的子图像进行神经网络的训练, 能更有效地利用带标签的样本,并得到更高的准确率。此外,针对我们在实验中遇到的具体问题,我们进一步改进了 U-Net 的方法,即不再将随机抽取的大量子图像作为模型的输入,而是直接随机抽取每张图像的 ROI 作为模型输入,我们验证了这种新方法更加高效和准确。最后我们在 U-Net 模型的基础上增加了边缘区域生长算法,并对比了原始方法与改进方法的 Dice 系数。

02

叶小清

肿瘤影像特征提取分析


个人简介

中国人民大学博士二年级在读,研究方向为肿瘤影像特征提取。


报告摘要

基于上述对肿瘤CT图像的分割,对肿瘤影像进行特征提取。特征提取的准确性和全面性直接影响淋巴转移分类模型的有效性,但是,过多地对特征进行提取,又会影响淋巴转移分类模型的速度。于是,我们提取了传统的二维和三维特征,如:表面积、体积、形状,纹理,小波系数等,又提取了最大最小横截面积、中心位置等创新特征,进而通过PCA进行降维。

03

刘晓玉

肿瘤影像特征与淋巴结转移的相关性验证


个人简介

中国人民大学博士一年级在读,研究方向为 Causal Inference,Treatment Effect。


报告摘要

在对前述报告所提取的图像特征和病人的临床数据PCA降维后,构造大量弱分类器,采用基于随机森林和 xgboost 的集成分类方法,分析了直肠肿瘤区域影像特征与是否淋巴结转移之间的关系,建立了基于CT影像和临床数据的全自动淋巴结转移分类模型并评估且对比了两种模型的表现。

04

苏蔚

函数型数据变系数模型的估计


个人简介

中国人民大学统计学院硕士在读,研究方向为 functional data analysis(函数型数据分析)。


报告摘要

本文提出了函数型数据变系数模型及其估计和推断,并将这一模型应用于研究在气象因素的影响下,沈阳市空气污染源排放情况对于污染物浓度的影响。

05

夏强

高维时间序列数据的降维处理

——因子个数的确定研究


个人简介

夏强,博士,华南农业大学数学与信息学院,教授,研究方向:时间序列分析,高维数据分析,贝叶斯计算。


报告摘要

For dealing with high-dimensional stationary time series, the factor model is often used to reduce the dimension. In this talk, we suggest a method of determining the number of factors in factor modeling. When the factors are of different degree of strength, the eigenvalue-based ratio method of Lam and Yao needs a two-step procedure to estimate the number of factors. As a modification of the method, however, our method only needs a one-step procedure for the determination of the number of factors. The resulted estimator is obtained simply by minimizing the ratio of the contribution of two adjacent eigenvalues. The finite sample performance of the method is well examined and compared with some competitors in the existing literature by Monte Carlo simulations and a real data analysis.

06

周海鹏

机器学习在LBS中的应用


个人简介

周海鹏,中科院硕士毕业,一直从事云存储、云计算开发及架构工作,专注于分布式存储、分布式计算、大数据分析等方向。长期从事IT技术工作,历经10年发展,从实践到理论均有所积累。现任TalkingData技术副总裁,从事大数据计算平台工作,对分布式存储和分布式计算、VLDB、大数据分析等有深刻实践,主持研发实时流式OLAP计算框架,分布式索引,分布式查询系统。同时关注高可靠、高可用、高扩展、高性能系统服务,以及Hadoop/HBase/Storm/Spark等离线、流式及实时分布式计算技术。参与多次大数据论坛,在业内具有一定的影响力。


报告摘要

位置服务在经济中起到越来越重要的作用,但是传统LBS服务多数是基于纯地理数据支持商业分析的,TalkingData 基于人本数据,结合机器学习等手段,整合了数据、算法,可以更实时、全景地观察现实世界,提高了分析效率、增强了分析的客观性。


解决的核心问题是:

1、如何利用大数据,解决线下世界人口、客流、画像等观测问题。这块主要是解决像零售、政府、金融等机构对现实世界进行调研的需求。

2、如何利用人工智能,结合上述的现实世界人口、客流、画像,结合传统的POI、道路、交通等数据,对现实世界,产业布局进行分析的需求。

3、如果利用产业布局的分析结果,在新兴城市、新兴市场中快速找到合适的渠道网络、定位人群、推广营销等。   

往期回顾


心理学专场

狗熊会专场

生物信息专场

时间序列预测

专场

医疗大数据

专场

工业工程

专场

可视化专场

人大统计专场

智能制造专场

隐私与数据

保护专场

智慧教育

专场

自然语言处理

专场

狗熊会个人会员产品义卖



12年对统计学的热爱,12年对数据科学的坚持,狗熊会向统计之都致敬,向中国R会议致敬!


为支持中国R会议筹集必要的运营资金,狗熊会个人会员产品现折扣义卖。原价200元/年,折扣义卖价100元/年,从2019.04.23至2019.05.31日结束,所有销售收入,全部捐赠给统计之都,用于支持中国R会议。

扫描二维码,了解狗熊会个人会员产品


友情提示

本活动不适合:价格敏感的小伙伴,因为狗熊会经常会发起各种公益活动,以几乎免费的价格赠送个人会员,请您耐心等待。


本活动适合:认同统计之都理念,热爱中国R会议,并愿意为之提供资金支持的土豪感谢土豪支持。

R 快速入门工作坊



为了满足大家对R语言快速入门的需求,统计之都COStudy心理学、公共卫生等项目针对学科特点,在会前17-19日开设meta分析(499元),R编程基础思路与概念(199元),R编程技巧与心理学数据分析项目实践(359元)三个工作坊,手把手带你入门R编程。

扫描二维码,报名工作坊


统计之都:专业、人本、正直的中国统计学社区。

关注方式:扫描下图二维码。或查找公众号,搜索 统计之都 或 CapStat 即可。

往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。

点击“阅读原文”,跳转至参会者报名网站

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/33046
 
42 次点击  
分享到微博