社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

机器学习工作流的分解及虚拟数据湖的应用

DataFunTalk • 1 年前 • 186 次点击  

Meetup

2022年9月23日(周五)上午10:00-11:00,由Alluxio举办的【Meetup】即将强势呈现!


本期邀请到的嘉宾是Alluxio产品经理——欧阳婧雯


欧阳婧雯本科和硕士均毕业于麻省理工,曾就职于Meta (Facebook), SanDisk,具备丰富的实战经验,而本期分享的主题是:《机器学习工作流的分解及虚拟数据湖的应用》

扫码免费参与直播

数据湖在异构数据存储方面的优势令其成为机器学习基础设施的首选。然而,传统的数据湖是资源密集型技术,依赖于代价高昂的永久数据拷贝,从而在数据创建和分析之间造成了延迟。随着时间的推移,这种延迟会逐渐造成新的数据孤岛的出现。

 

成功落地机器学习不仅要统一管理异构数据,还要实现顺畅的工作流。一个机器学习模型的端到端生产工作流一般分为五步,即数据收集, 数据预处理, 模型训练, 模型评估, 模型推论,本次直播会分享它们的特色以及与数据的关系,同时还会包含在各个步骤中Alluxio作为虚拟数据湖的应用和带来的好处,更多详细内容敬请关注9月23日的直播活动,听婧雯老师细细道来:

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/147072
 
186 次点击