Py学习  »  机器学习算法

京东硅谷首席科学家领衔,图机器学习峰会震撼开启!

DataFunTalk • 2 年前 • 441 次点击  
深度学习模型是当今人工智能研究的核心。众所周知,对欧几里得数据(例如图像)和序列数据(例如文本)具有颠覆性学习能力的深度学习技术不能直接适用于图结构数据。这种差距推动了图深度学习研究的浪潮。近年来,已经开发了大量基于图结构数据的神经网络架构,这些架构已经成功应用于社交网络、计算机视觉,自然语言处理,推荐系统,智能风控,智能交通和生物计算学等领域,并取得了显着的性能提升。这波图论与深度学习交叉的研究浪潮也影响了其他科学领域,包括计算机视觉、自然语言处理、归纳逻辑编程、程序合成与分析、自动化规划、强化学习和网络安全。尽管图上的深度学习已经引起了极大的关注,但将其应用于其他领域时仍面临许多挑战,包括从方法论的合理性到实际商业业务表现。  
2021年10月10日,DataFunSummit:图机器学习在线峰会将如约而至。本次峰会的形式再次创新,由图与推荐DataFun联合策划、京东硅谷研发中心 首席科学家 吴凌飞博士腾讯大数据 AI平台总监 陶阳宇博士领衔参与,既包括前沿的学术分享、又有来自国内外头部大厂的工业实践分享,专家云集,会议全程直播,精彩不容错过!
本次峰会共设置GNN基础模型、复杂图、大规模图平台、推荐与图、NLP与图、风控与图、生物计算与图等7大论坛,将从多个视角,带你彻底了解图机器学习!
识别二维码,即可免费注册报名:

▌峰会日程

▌具体安排

本次峰会我们将涵盖图深度学习的广泛主题,即图神经网络,内容包括从方法论到应用,从基础到技术的新前沿。当然我们也关注到没法全面涵盖图神经网络这个快速增长的领域,及时应对新技术和应用的不断涌现。因此,我们组织这个峰会的目的是希望提供一个高水平的技术交流平台,让来自世界各地的高校的领域专家和各个头部公司的算法专家,来畅谈图神经网络在算法设计,实用的业务应用实践的经验和教训;同时让众多的从业者有机会学习,探讨,从而推动图神经网络在各个领域普遍推广,发挥更实际的产业价值。

下面我们一起来看看具体安排吧:

PS:嘉宾分享顺序以会前最终确认版为准






▌详细介绍

1

峰会主席






吴凌飞 京东硅谷研发中心 首席科学家


个人简介:吴凌飞博士毕业于八所公立常春藤盟校之一的威廉与玛丽学院计算机系。现任京东硅谷研发中心首席科学家,带领一支30多人的机器学习和自然语言处理的科学家和工程团队,从事开发智能个性化的电商推荐和搜索系统。吴博士曾经是IBM T. J. Watson Research Center研究科学家和团队带头人。他的研究内容包括机器学习,表征学习,和自然语言处理。吴博士带领的Graph4NLP (Deep Learning on Graphs for Natural Language Processing) 团队(10+ 研究科学家)致力于机器学习与文本数据挖掘领域的基础研究,并运用机器学习与文本数据挖掘方法解决实际问题。其学术成果先后发表在NeurIPS, ICML, ICLR, ACL, EMNLP, KDD, AAAI, IJCAI等国际顶级会议及期刊上,发表论文超过90多篇。多项学术论文获得著名国际大会的最佳论文和最佳学术论文奖,包括IEEE ICC 2019。其研究成果被各大媒体竞相报道,包括NatureNews, YahooNews, Venturebeat, TechTalks, SyncedReview, Leiphone, QbitAI, MIT News, IBM Research News, and SIAM News. 由于其突出的商业和学术贡献,吴博士带领的Graph4NLP团队获得了IBM Research Research Accomplishment Award (IBM全球1%的最佳团队),其个人被授予IBM Outstanding Technical Achievement Award (IBM全球最好的1% 员工)。吴博士是40项美国专利的发明人,因为这些专利极为突出的商业价值,被IBM 评选为 大师发明家 (2020), 全球仅仅有40名IBM研究科学家被授予此项荣誉。

2

联合主席






陶阳宇 腾讯大数据 AI平台总监

个人简介:陶阳宇,腾讯大数据AI平台总监,负责腾讯太极机器学习平台研发,支持腾讯广告推荐、金融支付、社交网络等业务场景的算法模型优化、训练与推理服务。带领团队开发了Angel机器学习、PowerFL联邦学习等框架,他拥有10余年机器学习、大数据、分布式系统领域从业经验,主要研究方向包括分布式机器学习系统、广告推荐算法、大数据平台等。

3

出品人






Eli Chien (簡翌)UIUC

个人简介:

Eli Chien is currently a Ph.D. student in the department of Electrical and Computer Engineering at the University of Illinois Urbana-Champaign. He works on a broad range of problems related to algorithms to process the non-Euclidean data, including (hyper)graphs and hyperbolic spaces. His researches mainly focus on connecting theory and practice by developing and analyzing principled algorithms. Specifically, his recent research results include Generalized PageRank algorithm, theory for graph neural networks, active learning on (hyper)graphs, hypergraph analysis for biology applications and classifications in the hyperbolic space. Previously, he also works on semi-supervised k-means problem, support estimation problem and statistical modeling for hypergraphs. His works got published in TIT, NeurIPS, ICLR, AISTATS, AAAI, ICDM, ISIT, ITW and ICASSP.

演讲议题:Adaptive Universal Generalized PageRank Graph Neural Network

议题介绍:

In many important graph data processing applications, the acquired information includes both node features and observations of the graph topology. Graph neural networks (GNNs) are designed to exploit both sources of evidence but they do not optimally trade-off their utility and integrate them in a manner that is also universal. Here, universality refers to independence on homophily or heterophily graph assumptions. We address these issues by introducing a new Generalized PageRank (GPR) GNN architecture that adaptively learns the GPR weights so as to jointly optimize node feature and topological information extraction, regardless of the extent to which the node labels are homophilic or heterophilic. Learned GPR weights automatically adjust to the node label pattern, irrelevant on the type of initialization, and thereby guarantee excellent learning performance for label patterns that are usually hard to handle. Furthermore, they allow one to avoid feature over-smoothing, a process which renders feature information nondiscriminative, without requiring the network to be shallow.Our accompanying theoretical analysis of the GPR-GNN method is facilitated by novel synthetic benchmark datasets generated by the so-called contextual stochastic block model. We also compare the performance of our GNN architecture with that of several state-of-the-art GNNs on the problem of node-classification, using well-known benchmark homophilic and heterophilic datasets. The results demonstrate that GPR-GNN offers significant performance improvement compared to existing techniques on both synthetic and benchmark data.




胡子牛 UCLA 博士生

个人简介:

Ziniu Hu is a third-year CS PhD student in UCLA advised by Prof. Yizhou Sun. His previous research focuses on developing machine learning methods that can efficiently and effectively handle graph-structured complex data, especially large-scale and multi-relational graphs.

演讲议题:知识图谱的自监督学习与逻辑推理

议题介绍:

Answering complex First-Order Logical (FOL) queries on large-scale incomplete knowledge graphs (KGs) is an important yet challenging task. Recent advances embed logical queries and KG entities in the vector space and conduct query answering via dense similarity search. However, most of the designed logical operators in existing works do not satisfy the axiomatic system of classical logic. Moreover, these logical operators are parameterized so that they require a large number of complex FOL queries as training data, which are often arduous or even inaccessible to collect in most real-world KGs. In this paper, we present FuzzQE, a fuzzy logic based query embedding framework for answering FOL queries over KGs. FuzzQE follows fuzzy logic to define logical operators in a principled and learning free manner. Extensive experiments on two benchmark datasets demonstrate that FuzzQE achieves significantly better performance in answering FOL queries compared to the state-of-the-art methods. In addition, FuzzQE trained with only KG link prediction without any complex queries can achieve comparable performance with the systems trained with all FOL queries.




易玲玲 腾讯 专家研究员

个人简介:易玲玲,腾讯专家研究员,微信数据中心图算法技术负责人。毕业于华南理工大学数学系,对数据挖掘、机器学习、网络科学、复杂系统有非常浓厚的兴趣。09年加入腾讯后一直专注于用户行为分析以及推荐算法的研究和应用。先后主导过QQ好友/群推荐、应用宝市场的app推荐、微信朋友圈广告lookalike系统、微信视频号推荐等项目。目前聚焦于探索社交推荐技术在视频号业务上的应用。当前主要的兴趣点是用户行为预训练,图算法和图计算技术的落地应用。

演讲议题:基于GNN的社交推荐算法设计和应用

议题介绍:主要介绍GNN算法在推荐系统中的应用,利用GNN技术将社交、跨域的行为数据应用到个性化推荐中,主要从借鉴DNN的特征学习思路以及传统的网络科学的思路来优化GNN的网络结构,以提高GNN的特征学习能力,提升业务的转化效果。




纪厚业 京东 DMT

个人简介:北邮博士,主要关注图神经网络和推荐系统,发表论文10篇,引用580+,其中包括WWW19最高引长文,WWW21 Best Paper Finalist;担任AAAI/WSDM/ACL/EMNLP/TNNLS/TOIS等顶级会议/期刊审稿人。曾在中科院自动化所/字节/淘宝/蚂蚁金服/达摩院/华为/京东/腾讯分享图与推荐技术。

PS:欢迎大家关注本次峰会主办方之一,推荐与图论坛出品人纪厚业博士的个人公众号:图与推荐。





瞿锰 蒙特利尔大学 博士生

个人简介:瞿锰,现为魁北克人工智能研究院(Mila)三年级博士生,导师为唐建教授。他硕士就读于美国伊利诺伊大学香槟分校(UIUC),师从韩家炜教授;本科就读于北京大学信息科学技术学院,师从张铭教授。他的研究兴趣为:结合深度学习与统计关系学习的知识推理、知识图谱推理、图表示学习等。他在ICML、NeurIPS、ICLR、KDD、WWW等会议中发表了多篇知识推理方向的论文,提出了GMNN、pLogicNet、RNNLogic等方法。他参与提出了图表示学习算法LINE,为WWW会议在2015-2019年期间被引用次数最多的论文。

演讲议题:基于逻辑规则学习的知识图谱推理

议题介绍:

Knowledge graph reasoning, which aims at predicting missing facts by reasoning with existing facts in a knowledge graph, is a fundamental task in machine learning. This talk focuses on the methodology of learning logic rules for knowledge graph reasoning. Logic rules provide interpretable explanations when used for prediction as well as being able to generalize to other tasks, and hence are critical to learn. Existing methods either suffer from the problem of searching in a large search space (e.g., neural logic programming) or ineffective optimization due to sparse rewards (e.g., techniques based on reinforcement learning). To address these limitations, we propose a probabilistic model called RNNLogic. RNNLogic treats logic rules as a latent variable, and simultaneously trains a rule generator as well as a reasoning predictor with logic rules. We develop an EM-based algorithm for optimization. In each iteration, the reasoning predictor is first updated to explore some generated logic rules for reasoning. Then in the E-step, we select a set of high-quality rules from all generated rules with both the rule generator and reasoning predictor via posterior inference; and in the M-step, the rule generator is updated with the rules selected in the E-step. Experiments on four datasets prove the effectiveness of RNNLogic.




徐冰冰 中国科学院计算技术研究所

个人简介:徐冰冰,2021年6月博士毕业于中科院计算所,现任中国科学院计算技术研究所特别研究助理。研究兴趣为可信网络表示学习,图神经网络等。在ICLR、IJCAI、SIGIR、AAAI等国内外学术会议曾发表相关工作。

演讲议题:图神经网络的对抗攻防研究

议题介绍:图神经网络模型在金融风控、推荐系统等众多领域中取得了巨大成功,引起人们的广泛关注。但已有研究表明图神经网络模型在面临对抗攻击时比较脆弱,模型性能容易在遭受攻击后下降。攻击者如何在耗费攻击资源最小、权限极其有限的情况下,进行有效且高效的攻击,是研究攻击的重要方向。在攻击方法层出不穷的今天,如何提高模型对于任何可行的攻击的认证鲁棒性,是防御方法的研究热点。本报告将介绍图神经网络在金融风控系统上的的最新进展,并对图对抗攻防前沿工作进行介绍。




马腾飞 IBM沃森研究所 研究员

个人简介:马腾飞,IBM沃森研究院研究员,本科毕业于清华大学,随后分别于北京大学和东京大学取得硕士和博士学位,研究方向为机器学习、自然语言处理和智能医疗等。他深耕图神经网络多年,近期的研究主要集中在图神经网络的可扩展性、生成模型及其在医疗、生化、自然语言处理等领域的应用。他在NeurIPS、ICLR、AAAI等人工智能国际会议上发表论文40多篇,在AAAI与KDD等会议上多次讲授关于图神经网络前沿的专题;他也是图神经网络科普书籍《图神经网络:基础与前言》的作者。

演讲议题:基于最优传输理论的无监督图压缩及其在时间线摘要上的应用

议题介绍:与在卷积神经网络中类似,池化也是图神经网络的重要组成部分,图神经网络通过池化得到图的层次化表达,从而有效的提升其在图分类等任务上的表现。这里我们介绍一种新的基于代数多重网格的可学习的图池化方式(OTCoarsen),并且借助最优传输理论我们使得它不需要依赖于任何标签即可进行训练,并能很好的转移到各种下游任务。另外,通过池化得到的粗图不仅仅是一个副产品,它本身可以被用来作为图压缩任务的输出,我们会介绍如何把上述图神经网络的池化方法扩展应用到自然语言处理的任务上,即通过事件图的压缩来产生时间线上的文本摘要。

活动虽好,别忘了扫码报名哦~


4

分享嘉宾






李攀 普渡大学 Assistant Professor

个人简介:

Pan Li joined the Department of Computer Science (CS) at Purdue University as an Assistant Professor in 2020 Fall. Before that, he got his Ph.D. in UIUC and did one-yearpostdoc in Stanford University. Dr. Li is interested in a broad range of problems related to graph algorithms and machine learning. His recent works include establishing spectral theory and clustering algorithms for higher-order graphs/hypergraphs, investigating foundations and applications of graph neural networks. Previously, he was a recipient of ECE Distinguished Research Fellowship at UIUC.

演讲议题:好的图表示到底是什么?

议题介绍:

In this talk, we will introduce some recent progress on studying what a good graph representation is. We investigate this problem from the information theoretical point of view. We will introduce how to use information bottleneck tools to make graph neural network better in  generalization and robustness. The framework can be used in both label-based superivised learning and self supervised learning. 




张文涛 腾讯Angel Graph 北京大学博士生

个人简介:张文涛,腾讯数据平台部 Angel Graph 团队成员,北京大学计算机系2020级博士研究生,师从崔斌教授。 他的主要研究兴趣为图数据挖掘(包含图数据,图模型和图系统三个层面),在SIGMOD,VLDB和KDD等国际顶级会议上发表论文10余篇。另外,他也是开源的分布式机器学习系统 Angel 的开发者之一。

演讲议题:图注意力多层感知器

议题介绍:图神经网络(GNN)已经成为解决图问题的重要算法,并受到了学术界和工业界的广泛关注。但在工业界的大规模数据集上使用GNN还是存在着以下两个问题:1)可扩展性低:受单机存储开销以及分布式通讯开销限制,大多数现有GNN算法很难部署在超大图上;2)灵活性差:大多数GNN强行约束非线性变换深度恒等于特征传播深度,也没有考虑节点的特异性。我们提出图注意力多层感知器(GAMLP)来解决这两个问题,本次报告主要介绍GAMLP的技术细节以及设计逻辑。




陈政道 纽约大学 博士生

个人简‍‍‍介:现在是纽约大学数学系的第五年博士生,受指导于Joan Bruna教授、Eric Vanden-Eijnden教授和Leon Bottou教授,主要研究兴趣包括图神经网络和深度学习理论。曾在Facebook和谷歌实习。

演讲议题:探索图神经网络的表达能力

议题介绍:当下,图神经网络(GNN)模型层出不穷,拥有广泛应用。为了从理论上理解它们的局限和相互之间的比较优势,我们需要对它们的表达能力(expressive power)加以研究。我将介绍几个不同的研究角度,包括图同构测试(graph isomorphism tests)、对子图的计数(counting substructures)和对游走的计数(counting walks)等。基于这些理论工作,我们提出了两个新的更具表达能力的图神经网络模型,在分子预测等任务中有优异表现。




金弟 天津大学 英才副教授(特聘研究员)

个人简介:金弟,天津大学智算学部英才副教授(特聘研究员),博士生导师。2012获得吉林大学博士学位,2013-2014在伯恩茅斯大学博士后,2019-2020在UIUC韩家炜老师组访问。一直从事图机器学习研究。近五年一作/通讯发表CCF A类论文20余篇,主持国家自然基金2项、国家重点研发计划子课题2项。担任AAAI/IJCAI SPC, IJCAI-19社交网络分析workshop Chair,IEEE Transaction on Big Data网络结构学习专刊Guest Editor。获CCF A类会议WWW-21最佳论文奖(Runner-up), 《自动化学报》优秀论文奖,ACM中国天津分会新兴奖, 中国商业联合会科技进步一等奖。

演讲议题:面向富文本网络的图神经网络及应用

议题介绍:图神经网络自提出以来迅速得到了学术和工业界的青睐,成为AI研究热点。现实世界中的许多图(网络)数据富含文本,其不仅表现为属性词,还蕴含着丰富的词序列上下文、主题结构等语义结构信息;要对其进行更好的理解,还需深度探索其先验知识;其还时常存在着复杂的文本属性缺失现象。这些也是人类理解富文本网络时面临的问题和可用到的信息。目前基于图神经网络的富文本网络表征主要将文本视为属性,采用属性词在拓扑上传播聚合的架构,难于充分有效利用以上全面信息。本报告介绍了我们针对以上问题的一些最新研究进展,并讨论其在真实世界场景中的应用及未来发展趋势。




孙笠 华北电力大学(北京)讲师

个人简介:孙笠,现就职于华北电力大学控制与计算机工程学院。本硕博均就读于北京邮电大学(2012年9月-2021年6月),于2021年6月在获得计算机科学与技术学科工学博士学位,导师为北京邮电大学副校长苏森教授。攻读博士期间,赴美国芝加哥伊利诺伊大学(UIC)联合培养,师从数据挖掘巨擘、ACM/IEEE Fellow Philip S. Yu教授。主要研究方向为社交网络分析与图机器学习,攻读博士期间参与国家重点研发计划、国家自然科学基金委联合培育项目,在人工智能与数据挖掘领域的顶级会议(AAAI、IJCAI、ICDM、CIKM)和顶级期刊IEEE TKDE上发表一系列高水平学术论文。积极参与学术服务,担任IEEE BigData 2019的分会场主席,ECAI2020、AAAI2021、AAAI2022和WSDM2022等顶级会议的程序委员。

演讲议题:Representing and Aligning Networks in Hyperbolic Spaces

议题介绍:图表征学习(Graph Representation Learning)作为一个基础问题得到了广泛关注。文献中通常将欧几里德空间作为图的表征空间。事实上,图是一类典型的非欧结构,那么,欧几里德空间是否是一个合理的表征空间?我们将从这一问题出发,对表征空间和图的双曲表征展开讨论。我们进一步结合图中广泛存在的不确定性和动态性,提出了一类变分双曲图神经网络HVGNN。在双曲图表征的基础上,我们将继续讨论一个多粒度的社交网络对齐方法。




徐童 中国科学技术大学 副教授

个人简介:徐童,中国科学技术大学副教授,硕士生导师。中国中文信息学会情感计算专委会执行委员、青年工作委员会与社会媒体处理专委会委员。近年来,在相关领域国际重要期刊及会议发表论文80余篇。主持国家自科面上/青年项目、国家重点研发计划子课题、微软亚洲研究院合作项目、百度松果计划项目等多个科研项目。受邀担任第11届IEEE国际知识图谱会议、2020全国社会媒体处理大会等会议领域主席及多个重要国际会议程序委员会委员。获国际学术会议KSEM 2020最佳论文奖、CICAI 2021最佳学生论文候选。

演讲议题:视频人物社交关系图生成与应用

议题介绍:视频中人物的社交关系是视频理解的重要基础之一,它既可以帮助观众更好地理解视频内涵,也将支撑许多视频相关的应用,如视频标注、视频检索和视觉问答等。事实上,人物之间的关系并不是相互独立的,而是彼此关联并形成完整的社交关系网络,并存在着相互佐证、相互强化的作用。在本次报告中,我们将介绍研究组发表于ACM MM 2021和ACM TOIS的两项最新工作,即如何利用图机器学习技术自动识别并生成视频人物社交关系图,进而将这一关系图应用于视频检索的下游任务以提升性能。




王敏捷 亚马逊 资深应用科学家

个人简介:王敏捷,亚马逊上海人工智能研究院资深应用科学家。

演讲议题:高效、易用、开放 | 图深度学习平台DGL介绍及展望




付浩 美团 算法工程师

个人简介:付浩,毕业于中国科学技术大学与微软亚洲研究院联合培养博士班,曾就职于微软小冰从事对话系统相关研究,现就职于美团搜索与NLP部从事图计算相关研究。

演讲议题:面向美团业务场景的图学习平台

议题介绍:图学习技术在美团业务中有诸多落地场景。本次报告从图学习平台的层面,介绍了在图学习技术落地过程中的挑战和解决方案。




许杰 腾讯 高级工程师

个人简介:17年硕士毕业于华南理工大学,现为腾讯高级工程师,负责Angel图计算平台的建设

演讲议题:Angel-Graph大规模图计算平台

议题介绍:本次分享可以分为3个方面,首先会介绍Angel图计算平台的架构设计,然后对分布式图计算的一些共性问题给出相应的解决思路,如超级节点,负载均衡,容错等,最后会简单介绍下目前平台支持的图算法系列。




尤佳轩 斯坦福大学 博士

个人简介:2017年获清华大学自动化系、经济系本科学位,2021年获斯坦福大学计算机系硕士、博士学位。我在AI顶会发表10余篇论文(10篇一作),引用量2300余次,h-index 11。我的主要研究方向是图表征学习,包括图学习模型、图生成模型、以及图启发的深度学习模型。我曾获AAAI 2017 CompSus 最佳学生论文奖,世界银行最佳大数据奖,并在ICML/NeurIPS/AAAI等会议上多次进行Oral/Spotlight演讲。我曾在Pinterest Lab, Facebook AI Research进行实习,与何恺明、谢赛宁老师合作发表论文。我在图学习方向的开源代码在Github上广受好评,共计收获2K余star。过去1年我作为PyG团队的核心领导者之一,对PyG代码、社区、发展方向上做出诸多贡献。博士期间我曾荣获百度奖学金、JPMorgan奖学金。

个人主页:cs.stanford.edu/~jiaxuan

演讲议题:PyG 2.0 & GraphGym 图学习平台

议题介绍:PyG是目前最受欢迎的图学习平台之一,在Github上拥有12.5K stars,每周下载量超过200万次。PyG与PyTorch可进行原生对接,在图学习GNN论文中被广泛使用。
本次演讲我会介绍PyG团队最新推出的PyG 2.0版本。在该版本中,我们重点推出了对异构图学习模型的支持。此外,我们将GraphGym(另一流行的图学习代码库)深度融入了PyG,从而向用户提供更加便捷的图学习接口,以便进行图神经网络架构搜索、大规模并行实验管理等等。
更多内容详见www.pyg.org




王大东 TigerGraph 高级研发工程师

演讲议题:图数据库安全控制




王晓伟 快手 AI算法研究员

个人简介:快手AI Platform AI算法研究员,硕士毕业于北京邮电大学,先后供职于阿里巴巴和快手,在推荐算法和图神经网络领域有多年的实践和优化经验。目前致力于图神经网络相关技术在召回、排序、冷启动、用户画像等场景的落地和优化,同时在算法、框架上进行沉淀,形成通用解决方案。

演讲议题:图神经网络在推荐召回中的应用和挑战

议题介绍:召回作为整个推荐系统的第一个环节,承担着极其关键的作用,在从全集内容中筛选出用户可能感兴趣子集的同时,又需要保证推理的高效。图神经网络在这两方面具有得天独厚的优势,我们可以利用图中蕴含的高阶结构关系,结合已有的属性信息,得到节点全面而精准的向量表示,应用于后续的召回。快手平台不同场景下的视频推荐特点和需求各有不同,基于图神经网络的召回方式在各个场景具体是如何应用的,又有哪些已优化或者亟待解决的问题?本次分享将结合实际场景的实现和优化进行介绍。




孙仕杰 腾讯 高级工程师

个人简介:广东工业大学硕士学历,校招加入腾讯,工作 7 年,在大数据分布式系统,分布式图计算系统,实时推荐系统后台等领域有一定的设计开发经验。

演讲议题:GNN算法在推荐系统上的算法设计和系统实现

议题介绍:主要介绍GNN算法在推荐系统中的应用,利用GNN技术将社交、跨域的行为数据应用到个性化推荐中,主要从借鉴DNN的特征学习思路以及传统的网络科学的思路来优化GNN的网络结构,以提高GNN的特征学习能力,提升业务的转化效果。




黄祥洲 美团 算法工程师

个人简介:本科毕业于华中科技大学,博士毕业于浙江大学,目前就职于美团NLP中心,从事图学习相关的工作。

演讲议题:图表征学习在美团推荐中的应用

议题介绍:主要介绍图表征学习在美团推荐相关业务上的探索和应用。




李厚意 阿里巴巴(前) 算法专家

个人简介:西安电子科技大学本硕,阿里巴巴前算法专家。淘宝的新一代的召回框架PDN的提出者、新一代GNN训练框架GraphTheta的创始人之一。

演讲议题:GNN算法的应用与专用训练框架

议题介绍:分享公开的三篇一作论文:第一篇在Open Graph BenchMark上夺冠的GNN算法:GIPA;第二篇是介绍淘宝的新一代的召回模型PDN,并从GNN的视角解读;第三篇是新一代的GNN训练框架,GraphTheta。




孙瑞鸿 腾讯 高级工程师

个人简介:孙瑞鸿,腾讯数据平台高级工程师,毕业于北京航空航天大学,毕业后加入腾讯数据平台Angel团队。开源分布式机器学习系统Angel核心开发人员,专注于AI框架、大数据、大规模分布式机器学习和图计算的研究。

演讲议题:Angel图神经网络在推荐场景下的实践

议题介绍:Angel图神经网络框架介绍,及推荐场景下的实践案例。




郭晓洁 京东硅谷研究院 研究科学家

个人简介:郭晓洁博士现任京东硅谷研究院的研究科学家。郭博士在2021年从美国乔治梅森大学取得信息技术与科学博士学位,博士期间的研究方向是机器学习,图深度学习和图生成。当前研究方向为机器学习和自然语言处理。其学术成果先后发表在ICLR, KDD, ICDM, CIKM, AAAI, KAIS 等多个国际顶级会议和期刊上,并曾以第一作者获得ICDM‘19最佳论文奖。且她的一篇一作论文获得了 ESI 高被引论文。郭博士多次担任国际顶级会议(如KDD, AAAI)和期刊(如TPAMI, TNNLS,TKDE,IJIS)的程序委员会成员和审稿人。

演讲议题:基于图深度学习的自然语言处理,方法与应用

议题介绍:图是一种可用来描述和建模复杂系统的通用语言。图在NLP的世界里无处不在,比如用来描述句法信息的dependency tree和constituency tree,以及描述语义信息的AMR graph。相比于简单地把自然语言建模成词袋(bag)或者序列(sequence),图能捕捉到自然语言更丰富和细致的信息。因此,对于许多NLP任务而言,图是一种非常合理的表示方式。例如,对于跨文本阅读理解任务,如果能够抽取出文本中的实体信息,并以图的形式建立起它们之间各种联系,将能有效帮助文本理解。而图神经网络(GNN)恰恰最擅长处理和建模图结构数据的。近年来,深度学习已经成为NLP领域的主要技术手段。在GNN被引入和广泛应用之前,深度学习领域一直缺少一种神经网络架构,能够像CNN适合处理网格数据那样,适合处理任意图结构数据。随着GNN研究的持续火热,越来越多的研究开始尝试用GNN来解决各类NLP问题。本次分享将从 NLP 图构建、NLP图表示学习、基于 GNN 的 Encoder-decoder 模型和 GNN 在 NLP 中的应用这四个维度对近年来图深度学习在 NLP 中的研究进展进行梳理和总结。此外,郭晓洁博士还会介绍团队开发的 GraphNLP,即首个针对 NLP 任务的 GNN 开源库。




刘邦 蒙特利尔大学 助理教授

个人简介:

Bang Liu is an Assistant Professor in the Department of Computer Science and Operations Research (DIRO) at the University of Montreal. He is a core member of the RALI laboratory (Applied Research in Computer Linguistics) of DIRO, as well as an associate member of Mila – Quebec Institute of Artificial Intelligence. He received his B.Engr. degree in 2013 from the University of Science and Technology of China (USTC), as well as his M.S. degree and Ph.D. degree from the University of Alberta in 2015 and 2020, respectively. His research interests primarily lie in the areas of natural language processing (NLP), data mining, multimodal and multitask learning, AI + X (e.g., animation, VR, health).

演讲议题:基于图学习的信息流挖掘与兴趣点建模

议题介绍:

In this talk, I will share with the audience my research experiences on a range of NLP tasks for information organization and user interests modeling. I will demonstrate that the graph is a natural way to capture the connections between different text objects, such as words, entities, sentences, and documents. By combining graph-structured representations of text objects at various granularities with Graph Neural Networks (GNNs), significant benefits can be brought to various NLP tasks. Finally, I will share my experience in deploying our algorithms in industry applications, such as Tencent QQ Browser, Mobile QQ, and WeChat, for hot event discovery, query and document understanding, as well as news feeds recommendation.




方泽阳 百度 资深研发工程师

个人简介:方泽阳,百度深度学习技术平台部资深研发工程师,毕业于北京邮电大学,主要是从事于Feed流新闻推荐和图学习相关的研发工作,曾带领团队获得KDD CUP知识图谱赛道冠军,并两次获得百度最高奖。

演讲议题:基于图神经网络的知识图谱表示

议题介绍:①知识图谱算法的发展历程;②图神经网络和知识图谱算法的结合;③大规模知识图谱表示技术发展;④ 知识图谱的应用案例。




李宗纯 度小满金融 AI产品经理

个人简介:硕士毕业于伦敦帝国理工学院,目前在度小满金融科技负责AI平台产品、AI算法产品的设计及推进应用等工作。

演讲议题:图机器学习在度小满金融风控中的应用

议题介绍:① 行业及技术背景介绍:包含金融科技领域风控技术发展历程;图技术在金融风控中的应用概述等;② 度小满金融图平台Eros介绍:包含度小满Eros平台在图存储、图算法、图建模及图可视化等部分的功能,以及图建模案例等;③ 度小满图平台Eros在金融风控中的应用:如反欺诈,智能催收,智能审核等。




牛亚峰 腾讯 高级工程师

个人简介:本科就读于新疆大学软件学院,在校期间曾获得校级十佳大学生、“高教社”杯数学建模大赛全国一等奖等。硕士就读于重庆大学计算机学院,在校期间曾获得优秀研究生、优秀毕业典范等荣誉称号。2018年就职于腾讯,工作期间多次获得优秀员工,目前负责网址安全检测项目。

演讲议题:图神经网络在反欺诈领域的应用

议题介绍:用于电信诈骗的水房卡具有使用周期短,洗钱速度快的特点。另外从案发、事主报案、再到警方通知银行冻结,这往往会错过冻结的黄金时期,很难帮受害者追回损失。针对这一难点,我们基于黑产行为,构建时序异构图,结合异构图神经网络进行分析,提早发现恶意卡,并提前布控。互联网在给大家带来便利的同时,同时也充斥着许多违法违规的内容,例如博彩、色情、欺诈等内容,为了保护用户免受其害,我们将异构图神经网络应用在赌博、色情等恶意网站的检测中,效果十分显著。




窦英通 伊利诺伊大学芝加哥分校 博士生

个人简介:窦英通,伊利诺伊大学芝加哥分校 (UIC)在读博士研究生,导师为Philip Yu。本科毕业于北京邮电大学。研究方向为图数据挖掘,欺诈及虚假信息检测,机器学习安全等。曾在KDD,WWW,SIGIR,CIKM 等学术会议发表多篇文章。在欺诈检测研究与实践中先后与华为,腾讯,亚马逊,微软,F5,Grab 等公司有交流和合作。

演讲议题:基于图神经网络的欺诈检测—从研究到应用

议题介绍:近年来,利用图神经网络(GNN)进行欺诈检测逐渐受到工业界和学术界的关注。本次分享将基于讲者个人研究与实践经验,从 GNN 在欺诈检测的最早应用开始,重点介绍 GNN 欺诈检测研究和应用的:发展历程、主要建模方法、学习资料资源、经验与挑战等。




陈振兴 京东科技 算法工程师

个人简介:北京大学物理学博士,FRM,在京东科技主要负责风控反欺诈模型研发,搭建了基于用户行为序列、关系网络的立体化智能反欺诈模型体系,应用于营销、交易等多个核心业务场景。在图方面,研发的图模型涉及传统图算法、Graph Embedding和图神经网络,均在线上取得很好的业务增益。此外,将规则学习融入风控建模,大幅提升模型可解释性。

演讲议题:图机器学习在智能反欺诈上的探索与实践

议题介绍:① 互联网欺诈的现状;② 传统反欺诈方法介绍;③ 不同图机器学习算法在反欺诈上的应用;④ 案例分享;⑤ 展望。




韩志超 eBay 高级机器学习工程师

个人简介:留英硕士,eBay支付风控团队机器学习高级工程师,在金融风控领域多年研发经验。加入eBay前,在对冲基金和投资银行就职,专注于基于时序数据的决策问题。

演讲议题:图神经网络在实时风控的应用

议题介绍:① 动态图的风控应用场景;② 规避未来信息的离线动态图设计;③ 规避线上图查询的网络架构;④ 分布式训练的实践。




方晓敏 百度 资深研发工程师

个人简介:百度资深研发工程师,先后负责深度学习相关技术在推荐系统,地图出行,生物计算等多元场景的应用落地。目前是百度生物计算药物研发方向的技术负责人,生物计算开源工具PaddleHelix螺旋桨的负责人。

演讲议题:图预训练技术在生物计算领域的应用

议题介绍:生物计算领域的数据获取成本非常高,导致许多深度神经网络未能充分发挥效果。预训练技术已在自然语言处理和图像处理中证明其卓越效果,充分利用了未标注数据去增强模型的表示能力。我们将介绍学界的图预训练方法,并介绍百度使用图预训练在生物计算领域的探索。




黄柯鑫 斯坦福大学 博士生

个人简介:斯坦福大学在读CS PhD,哈佛大学硕士,纽约大学本科。主要研究方向为机器学习去解决生物医疗问题。之前在Pfizer,IQVIA,Dana Farber,Flatiron Health,Rockefeller University等做研究。

演讲议题:图机器学习在生物图上的应用 Graph Machine Learning in Molecular Networks

议题介绍:

Graphs are omnipresent in biomedicine, ranging from macro-scale molecular graph, all the way to large interconnected biological knowledge graph. Graph neural networks allow a new way to represent biomedical concepts and these powerful representations can unlock numerous downstream tasks. In this talk, I will talk about key challenges in graph machine learning in molecular networks and several of our recent algorithms that can tackle them. 




史晨策 蒙特利尔大学 博士生

个人简介:蒙特利尔算法研究所(Mila)二年级博士生,师从Jian Tang。主要研究方向为深度生成模型、图表示学习以及他们在基础自然科学中的应用(如新药发现和材料学)。北京大学第一届图灵班毕业生,本科导师张铭教授, 获得北京大学信息科学技术学院“十佳”毕业论文奖。以第一作者身份在ICML/ICLR等顶级机器学习会议发表多篇论文。
个人主页:https://chenceshi.com

演讲议题:基于梯度向量场的分子三维结构生成

议题介绍:基于二维图结构的分子表示(节点代表原子,边代表化学键)已被广泛地应用于各种分子建模任务。然而, 分子的一个更本质的表示是它们的三维结构,其中每个原子由一个三维坐标来表示。我们研究了如何基于二维分子图预测其稳定的三维结构。现有的机器学习方法通常首先预测原子之间的距离,然后生成满足这些距离约束的三维结构。然而,预测的距离往往带有误差(如不满足三角不等式),这种方法生成的三维结构往往误差较大。受传统的分子动力学模拟力场方法的启发,我们提出了一种称为ConfGF的新方法, 来直接估计原子坐标密度(density)的梯度场。基于此梯度场,稳定的构象可由朗之万动力学生成。然而,这种方法非常具有挑战性,因为梯度场是旋转等价的。我们注意到,对原子坐标梯度场的估计可以转化为对原子间距离梯度场的估计。基于此发现, 我们提出了一种基于分数生成模型的新算法来有效地估计这些梯度场。多个任务的实验结果表明,ConfGF超越了之前的所有机器学习模型。

▌峰会报名

本次峰会将全程直播,欢迎大家识别二维码,免费注册报名:

10月10日,我们不见不散~

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/120652
 
441 次点击