社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

微软AutoML工具,现已加入Azure机器学习服务豪华套餐

微软研究院AI头条 • 5 年前 • 456 次点击  


编者按:如果你是机器学习小白,你是否还对着五花八门的机器学习模型和超参数调整感到一头雾水?如果你是调参调到身心俱疲的机器学习er,你是否还在坚持不懈地摸索调参“玄学”?昨天,微软在Ignite大会上最新发布了一套AutoML工具,并已整合进Azure机器学习服务,可以帮你自动完成数据转换、模型选择、超参数工作。这下选择困难和脱发都有救了!


周一,在美国佛罗里达州奥兰多召开的Ignite大会上,微软发布了自动机器学习工具公开预览版,并将其整合到了Azure机器学习服务中


从研究到产品

自动机器学习工具最初来自于微软一项将AI技术应用到生物学的研究项目。在这项研究中,微软研究员Nicolo Fusi和同事们开发了CRISPR.ML工具,借助机器学习帮助生物学家提高CRISPR基因编辑准确率。


微软研究员Nicolo Fusi


在研究过程中,微软的研究人员和机器学习专家在机器学习模型的选择问题上经常会出现意见相左,并且模型的测试和调参过程非常繁琐冗长,花费了大量的时间。


为了解决这一问题,Fusi着手开发了另一个AI工具,用于自动完成AI开发过程中的数据转换、模型选择和超参数调节等工作。


随后,通过与Azure机器学习团队合作,这一自动机器学习的技术最终被整合到了Azure机器学习服务中,供广大AI开发者使用。


自动机器学习工具中包含了两项最重要的功能——机器学习模型的自动选择以及决定模型性能的超参数的自动调节。这两项自动化功能将让更多没有机器学习开发经验的客户得以进行自主的AI开发。


同时,自动机器学习也能够帮助到机器学习专家。这一自动化工具提供了一种便捷的方法,让数据科学研究中大量的繁琐乏味的工作实现了自动化,让科学家们能够专注于其它更重要的功能开发方面的工作。


推荐系统

自动机器学习工具处理数据集的过程类似于在线流媒体服务的电影推荐过程。流媒体服务的新用户观看了几部电影并进行评价之后,系统就会向用户推荐其它新的电影。系统对用户评分最高的电影了解得越多,它后续提供的推荐就会越符合用户的口味。


与此类似,自动机器学习工具也在用户的新数据集上运行以不同方式进行超参数调整的一些模型,来掌握不同调参方法的准确程度,并在此基础上进行进一步的调整,进行成千上万次的迭代。



最终,开发者将会得到一个效果良好的机器学习模型。并且,这一系统永远不需要查看用户数据,用户的数据集仍然保存在他们的本地计算机或者储存于受微软隐私政策保护的Azure虚拟机中。


Azure机器学习团队在进行技术验证、产品测试和与客户进行基准测试的过程中,为客户找到了几种新的自动机器学习工具使用方法。


例如,对于在不同地理位置拥有数百乃至数千台设备(比方说风电场上的风电机)的客户,可以使用自动机器学习功能针对每台设备的机器学习模型进行微调,而此前,这一操作所需的成本和时间是难以承受的。


此外,数据科学家也可以借助自动机器学习工具,验证手工选择和调参的机器学习模型的有效性。在验证过程中还有可能发现一个意想不到的更佳模型。


重构Azure机器学习服务

自动机器学习工具是微软推动Azure机器学习成为端到端解决方案的一部分,微软希望Azure机器学习服务能够帮助所有人构建和训练机器学习模型,并将模型部署到任何地方——无论是在云端,在企业内部,还是在边缘设备上。


除了自动机器学习工具,微软还宣布Azure机器学习服务加入了一个可用于目前广受数据科学家欢迎的Python编程语言的软件开发工具包(SDK)。该SDK包括Visual Studio Code、PyCharm、Azure Databricks notebook和Jupyter notebook,实现了Azure机器学习服务与Python开发环境的整合。


微软负责AI平台业务的资深副总裁Eric Boyd表示,“我们一直在聆听用户心声。开发者希望能够自由使用任何开发工具和框架,我们需要重新思考向这些用户提供Azure机器学习服务的方式。因此,我们推出了Python SDK,它可以实现许多不同的功能。”


这些功能包括分布式深度学习和允许开发者使用功能强大的现场可编程门阵列(FPGA)。通过分布式深度学习,开发人员能够通过大规模图形处理单元(GPU)集群更快地构建和训练模型;利用现场可编程门阵列(FPGA),开发者可以在Azure上实现高速图像分类与识别等应用场景。


相关论文:

Probabilistic Matrix Factorization for Automated Machine Learning

https://arxiv.org/abs/1705.05355


访问Azure机器学习服务:

https://azure.microsoft.com/en-us/overview/machine-learning/


你也许还想看


 借助机器学习提高CRISPR基因编辑准确率

 AutoML不够用,智能系统才是人工智能的未来

 NIPS 2018丨解读微软亚洲研究院10篇入选论文



感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。




今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/oSXObgLq4a
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/24386
 
456 次点击