社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

万万没想到!字节跳动基于 HPC 的大规模机器学习技术这么强!

机器学习算法与自然语言处理 • 3 年前 • 279 次点击  

MLNLP(机器学习算法与自然语言处理)社区是国内外最大的自然语言处理社区之一,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步。

随着智慧科研、自动驾驶、基因测序、量化投资等大量新兴产业的发展,现代产业对模型训练有了大量的需求,模型体积也呈现爆发式地增长。而大模型训练给底层基础设施,尤其是计算能力带来了不小的挑战。

4 月 14 日,火山引擎开发者社区技术大讲堂第一期将为大家揭秘字节跳动基于 HPC 的大规模机器学习技术。字节跳动经过业务实践打磨的机器学习技术将首次亮相开发者社区,并由技术负责人项亮公开深度分享,与广大开发者互动。同时,承载机器学习平台的超大规模 HPC 基础设施也将首度在社区分享。

活动时间2022/04/14(周四)19:30-21:00

活动形式线上直播

       

《火山引擎大规模机器学习平台架构设计与应用实践》

项亮|字节跳动 AML 负责人

本次分享将围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等 AI 工程化实践,全面介绍如何以开发者的极致体验为核心,进行机器学习平台的设计与实现,带大家了解当前机器学习应用落地过程中的挑战以及火山引擎如何应对这些挑战。

分享主要内容:

1. 机器学习应用开发过程中的挑战

2. 火山引擎机器学习平台的架构

3.  字节跳动内部及行业头部客户的机器学习应用实践案例


《大规模高性能计算集群架构及优化实践》

叶璐|火山引擎云计算研发工程师

冯瑞青|火山引擎云计算研发工程师

随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享将主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践,带大家了解火山引擎支撑大规模高性能计算集群的架构和优化实践。

分享主要内容:

1. 模型训练的趋势及对基础设施的要求

2. 火山引擎高性能计算实例相关产品介绍及平台架构

3. 支撑超大规模训练的 RDMA 网络架构和优化

4. 字节跳动内部及合作伙伴的业务实践

扫码立即报名

    扫码进入活动群

关于我们

MLNLP(机器学习算法与自然语言处理) 社区是由国内外自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外最大的自然语言处理社区之一,旗下包括万人顶会交流群、AI臻选汇、AI英才汇以及AI学术汇等知名品牌,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/131156
 
279 次点击