Py学习  »  机器学习算法

Math4DS 直播 NO.3 |普林斯顿大学统计与机器学习中心教授王梦迪

运筹OR帷幄 • 3 年前 • 364 次点击  


↑↑↑↑↑点击上方蓝色字关注我们!






『运筹OR帷幄』原创


作者:唐博




编者按



Online Seminar on Mathematical Foundations of Data Science (Math for DS) [1]是在线的、每周举办的系列研讨会。研讨会旨在讨论数据科学、机器学习、统计以及优化背后的数学原理,邀请了北美诸多知名学者进行主题演讲。『运筹OR帷幄』作为合作媒体,将在其B站持续为大家带来直播和回放。




Online Seminar on  Mathematical Foundations of Data Science(Math4DS)是在线的、每周举办的系列研讨会,其内容涵盖数据科学、机器学习、统计以及优化背后的数学基础。


在线研讨会将在Zoom上进行,有关研讨会的公告和Zoom链接,可通过点击阅读原文,链接到国内镜像网址获得。


此外,『运筹OR帷幄』公众号平台会及时预告研讨会的最新消息,由于Zoom会议的人数上限,我们会在Bilibili为大家带来研讨会的直播和回放,诚邀各位参与和观看。


研讨会邀请到诸多知名学者进行主题演讲,目前受邀参加的有:


上滑查看全部直播系列日历


Math for DS 第三期线上直播预告

主题:

On the Statistical Complexity of Reinforcement Learning

嘉宾:王梦迪

时间:北京时间5月27日凌晨三点

地点:Zoom、『运筹OR帷幄』哔哩哔哩直播间


主题介绍

Recent years have witnessed increasing empirical successes in reinforcement learning (RL). However, many theoretical questions about RL were not well understood. For example, how many observations are needed and sufficient for learning a good policy? What is the regret of online learning with function approximation in a Markov decision process (MDP)? From logged history generated by unknown behavior policies, how do we optimally estimate the value of a new policy? In this talk, I will review some recent results addressing these questions, such as the sample complexities for solving MDP from a generative model, minimax-optimal off-policy evaluation by regression, and regret analysis of model-based RL.


嘉宾介绍

王梦迪,普林斯顿大学电子工程系以及统计与机器学习中心的副教授。同时,她还隶属于运筹与金融工程系及计算机系。王梦迪于2007年从清华大学获得信息科学与控制论学士学位,于2013年获得麻省理工学院电子工程和计算机科学博士学位。她的研究专注于数据驱动的随机优化及其在机器学习和强化学习中的应用。


研讨会主办方简介

组织者:

Ethan X. Fang, Niao He, Junwei Lu, Zhaoran Wang,  Zhuoran Yang, Tuo Zhao


赞助方:

最后,『运筹OR帷幄』作为合作媒体,将在其B站持续为大家带来北美Math4DS系列的直播和回放,敬请关注!

https://space.bilibili.com/403058474


参考文献

[1]https://sites.google.com/view/seminarmathdatascience/home


关于本文责编


相关文章推荐

北美Math4DS第二期线上直播由普林斯顿大学范剑青教授进行主题演讲,『运筹OR帷幄』作为官方合作媒体,将在其B站为大家带来直播和回放。了解『运筹OR帷幄』更多直播信息,欢迎关注我们的官方B站:运筹OR帷幄。

点击蓝字标题,即可阅读《Math4DS 直播 NO.2 | 普林斯顿大学运筹与金融工程教授 范剑青》



本文福利

可以在 公众号后台 回复关键词:“ 网盘 获取大量由我平台编辑精心整理的学习资料,如果觉得有用, 请勿吝啬你的留言和赞哦!


—— 完 ——



文章须知

文章作者:唐博

责任编辑:唐博 留德华叫兽

审核编辑:阿春

微信编辑:玖蓁

本文由『运筹OR帷幄』原创发布

如需转载请在公众号后台获取转载须知




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/63561
 
364 次点击