Py学习  »  机器学习算法

《机器学习算法竞赛实战》的作者王贺邀请你参加开源学习论坛啦!

图灵教育 • 1 年前 • 167 次点击  

 世界人工智能大会 

AI开源学习与开发者成长论坛


在《新一代人工智能发展规划》中,开源开放确立为AI发展的四大原则之一。目前,随着AI开源基础设施的逐渐成熟,开发者如何参与开源,如何持续成长,如何为AI生态贡献力量是个重要的议题。


9月3日,AI开源学习与开发者生态论坛将在线上举办。



活动由世界人工智能大会组委会办公室指导,上海市人工智能行业协会主办,Datawhale发起并承办。



欢迎扫码报名



本次活动秉承“从学习者中来,到学习者中去”的理念,邀请了开源学习社区中的贡献者,以亲历者的身份分享开发者如何从0到1参与开源学习,持续成长的干货经验。我们《机器学习法竞赛实战》一书的作者王贺就将作为嘉宾进行以“开源分享,竞赛成长”为主题的分享!


简介:王贺,Datawhale成员,competition-baseline项目核心贡献者,金融量化策略研究员, 2019和2020年连续两年荣获腾讯广告算法大赛冠军, 国内外算法竞赛五冠六亚的竞赛大神,出版著作 《机器学习算法竞赛实战》。


关于《机器学习算法竞赛实战》这本书


本书以算法竞赛为引导,给出了采用机器学习解决实际问题的主要过程,从问题建模、数据探索、特征工程、到模型训练和模型融合,并分别列举了这个过程中的主要难点要点、通用思路和解决方法。在后续章节中,以实际的竞赛题目为落脚点,阐述和佐证如何通过问题剖析、数据治理、融合探索等方法论,使得算法逐步发挥其重要作用。


对于本书的章节架构,我们除了进行仔细的讨论外,还采纳了国内多名顶尖竞赛选手的建议。算法竞赛本身涵盖的范围是很大的,我们的理念是剖析其最本质的内容,然后结合多个领域模块进行实战讲解,这也是本书的一大特色。


本书分为以下四个部分:

Part1
磨刀事半,砍柴功倍

这部分以算法竞赛的通用化流程为主,介绍竞赛中各个部分的核心内容和具体工作,且每章都配有具体的实战部分,以便加深理解。

Part2
物以类聚,人以群分

这部分主要介绍用户画像相关的问题,构建完善的标签体系是用户画像的核心,也是解决用户画像类赛题的关键,比如个性化推荐和金融风控等问题都需要用户画像作为支撑。为了帮助读者加快对此类竞赛问题的学习、理解,会讲解具体的竞赛案例,即Kaggle平台的Elo Merchant Category Recommendation。

Part3
以史为鉴,未来可期

这部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析两个具体的实战案例,分别是天池平台的全球城市计算AI挑战赛和Kaggle平台的Corporación Favorita Grocery Sales Forecasting。

Part4
精准投放,优化体验

与计算广告相关的业务都是很好的竞赛题目,这部分主要介绍了计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价。实战案例部分则包括两道赛题,分别是2018腾讯广告算法大赛——相似人群拓展和Kaggle平台的TalkingData AdTracking Fraud Detection Challenge。

Part5
听你所说,懂你所写

这部分基于自然语言处理相关的内容进行讲解,包括常见任务和常见技术,实战案例部分是Kaggle平台上的经典竞赛Quora Question Pairs。

本书是算法竞赛领域第一本系统性介绍竞赛的书籍,不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/146680
 
167 次点击