Py学习  »  机器学习算法

Gartner2018数据科学和机器学习平台魔力象限上的赢家和输家

唤之 • 6 年前 • 549 次点击  

Gartner一直在变更这份报告的名称(以及市场部分的内容)——2018年2月23日发布的2018年最新版,被命名为《数据科学和机器学习平台的魔力象限》(在机器和学习之间有一个老式的破折号)。2017年,报告名称是《数据科学平台的魔力象限》,2014-2016年,名称则是《高级分析平台的魔力象限》。这些变化反应了行业在内容和能力上的快速改变,以及与AI和机器学习成长相关的品牌间的演变。

Gartner这样定义数据科学和机器学习平台:

它是一个具有凝聚力的软件应用程序,提供基本的融合各构件模块的能力,既可以创建各种数据科学的解决方案,又可以将这个解决方案集成到业务流程及所涉及的周边基础设施及产品中去。

正如我们将在下面论述的那样,2018年的变化将非常重要。

2018年的报告采用多个标准评估了16家分析和数据科学公司,并基于产品前瞻性和执行力将它们放置在4个象限中。

请注意,虽然像Python和R这样的开源平台在数据科学市场中扮演着越来越重要的角色,但是Gartner的研究方法并没有包括它们。

图1:Gartner 2018 数据科学和机器学习平台的魔力象限

公司介绍:

  • 领导者(5):KNIME, Alteryx, SAS, RapidMiner, H2O.ai
  • 挑战者(2):MathWorks, TIBCO软件(新进入)
  • 远见者(5):IBM、微软、Domino数据实验室、Dataiku、Databricks(新进入)
  • 特定领域者(4):SAP、Angoss、Anaconda (新进入)、Teradata

2017年新进入了三家公司:TIBCO软件、Anaconda和Databricks。

在2017年的MQ中,还有3家公司被删除:FICO、Quest和Alpine数据。我们注意到,Alpine数据公司和Quest的Statistica资产被TIBCO收购,所以TIBCO出现在这次的MQ中,其位置接近于2017年的Quest。

正如我们在之前的文章《Gartner 2017 数据科学平台MQ :赢家和输家》中所做的那样,我们将最新的2018 魔力象限与它之前的版本进行了比较。下面我们将研究这些变化以及其中的赢家和输家。

图2:Gartner对数据科学和机器学习平台的魔力象限进行比较,2018 vs 2017

图2显示了2017 MQ(灰色背景图像)和2018 MQ(前景图像)的对比状况,箭头连接的圆点表示同一家公司。如果公司的位置明显改善(远离刚开始的位置)箭头会是绿色的,位置变弱箭头将用红色表示。绿色圆圈代表新公司,而红色X表示公司离开了这次的魔力象限。

领导者:

自2014年以来,我们第一次有了改变。IBM过去曾属于领导者,但由于执行能力较低,它被放到了远见者象限。KNIME在前瞻性轴上有显著的进步,SAS在同一轴上向后移动,RapidMiner在执行能力上下降了一点。

2018年有两家公司首次加入了领导者行列:H2O.ai,从远见者象限进入;Alteryx公司,从挑战者象限进入。

下面是每个公司的简短介绍。对于完整报告,请参见文章末尾的链接。

KNIME提供了开源的KNIME分析平台产品,全世界有超过100K用户。KNIME为企业在协作、安全性和效率方面的部署提供商业支持和扩展。2017年,KNIME增加了AWS和微软Azure平台的云版本,提高了数据质量特征,扩展了深度学习能力。

Gartner点评:

该厂商拥有对市场的深刻理解力、健壮的产品策略和丰富的用例优势。这些特质凝聚在一起,巩固了它作为领导者的地位。

Alteryx平台可以使普通数据科学家能够在一个独立的工作流中构建模型。在2017年,Alteryx成功进行了IPO,后来收购了Yhat,Yhat是一个专注于模型部署和管理的数据科学供应商。

Gartner点评:

Alteryx已经从挑战者的象限发展到领导者象限。这要归功于强有力的执行(在收入增长和客户获取方面),引人瞩目的客户满意度,以及专注于帮助组织机构在不需要聘请专家数据科学家的情况下引入数据和分析文化的产品愿景。

SAS为分析和数据科学提供了许多软件产品。对于它的MQ,Gartner评估了SAS企业版Miner (EM)和SAS可视化分析套件的产品。

Gartner点评:

SAS仍然处在领导者行列,但是在前瞻性和执行力方面已经失去了一些优势。Visual Analytics的套件遵循了产品愿景,因为它的Viya云就绪架构比以前的SAS架构更加开放,并且使得更多的用户能够获得分析能力。然而,令人困惑的多产品策略使SAS的产品前瞻性变得越来越糟糕,并且对高授权成本的理解削弱了它的执行力。随着市场的关注点转向开源软件和更灵活的产品,SAS正在为自己在推出具有粘性的开放平台上的迟缓行为付出代价。

RapidMiner平台包括RapidMiner Studio模型开发工具(有免费版和商业版)、RapidMiner服务器和RapidMiner Radoop。

Gartner点评:

RapidMiner仍然处在领导者行列,它给各种各样的数据科学家和数据科学团队提供了一个全面且易于使用的平台。RapidMiner通过提高生产力和性能能力,继续强化核心数据科学和模型开发及执行的速度。

H2O.ai提供开源的机器学习平台产品,包括H2O Flow,其产品的核心组件;H2O Steam;H2O Sparkling Water,用于Spark集成;以及H2O Deep Water,它提供深度学习的能力。

Gartner点评:

H2O.ai已经从之前的远见者象限发展到领导者象限。它继续通过重大的商业扩张获得发展,并巩固其作为思想领袖和创新者的地位。

挑战者

  • MathWorks仍然是一个挑战者,得益于它在高级分析领域的高知名度、庞大的装机量和强大的客户关系。然而,由于其对工程和高端财务场景的专注限制了其产品的前瞻性,还有一些客户对其评分也较低。
  • TIBCO软件公司(新入公司)在2017年6月从Quest Software公司那里收购了著名的Statistica软件平台,从而进入了这个市场。2017年11月,该公司还收购了Alpine Data,这家公司2017年就处在MQ的远见者行列。对于执行能力,这次MQ仅评估TIBCO Statistica平台的能力。TIBCO的其他收购只对其前瞻性产生影响。

远见者

IBM提供了许多分析解决方案。对于这次的MQ, Gartner评估了SPSS Modeler和SPSS Statistics,没有评估Data Science Experience(DSX),因为它没有满足Gartner执行力轴的评估标准。

Gartner点评:

IBM现在处在远见者象限,与其他厂商相比,在产品前瞻性和执行能力方面都已经失去了优势。然而,IBM的DSX具有激发更广泛且具有创新性的前瞻性产品的潜力。IBM已经宣布计划在2018年为SPSS产品实现一个新的接口,以将SPSS Modeler完全集成到DSX中。

微软为数据科学和机器学习提供多种产品。对于云计算,产品包括Azure机器学习、Azure数据工厂、Azure流分析、Azure HDInsight、Azure Data Lake和Power BI。

对于on-premises计算,微软为SQL Server提供了机器学习服务(在此次MQ的截止日期之后的2017年9月发布)。只有Azure机器学习工具全部满足了这次MQ包含的所有标准。

Gartner点评:

微软仍然处在远见者象限。它这次的位置是由于市场反应能力和产品生存能力的低分造成的,因为Azure机器学习工具的云计算特性限制了许多高级分析场景的可用性,这些场景需要使用on-premises选项。

Domino (Domino Data Lab)数据科学平台是专家数据科学团队的端到端解决方案。该平台的专注点是集成来自开源软件和专有工具生态系统的工具,以实现协作性、再现性以及模型开发和部署的集中化。Domino虽然仍在远见者象限,但是它显著提高了执行力。

Gartner点评:

Domino……在机器学习生命周期的开始阶段(数据访问、数据准备、数据探索和可视化),执行能力虽然有所提高,但仍然被产品功能性问题拖了后腿。然而,在过去的一年里,Domino充分展现了在竞争激烈的市场中赢得新客户和获得关注的能力。

Dataiku提供Data Science Studio (DSS) 产品,专注于跨学科协作和产品易用性。

Gartner点评:

Dataiku仍然在远见者象限……因为DSS能够使用户快速启动机器学习项目。它的产品前瞻性在于对协作和开源的支持,这也是它的产品路线图的重点。由于在场景用例方面的广度相对较差,以及自动化和数据流方面的不足,它的产品前瞻性得分低于之前的MQ。

Databricks (新入公司)在云产品中提供了基于Apache spark的Databricks统一分析平台。该产品还提供安全性、可靠性、操作化和性能方面的专有特性。

Gartner点评:

Databricks是这次魔力象限的新进入者。作为远见者,它借鉴了开源社区的经验并结合自己的Spark专业知识,为用户提供了一个易于访问且熟悉的平台。除了数据科学和机器学习之外,Databricks还关注数据工程。2017年获得1.4亿美元D轮融资,这为Databricks提供了丰富的资源,以扩展其部署选项并实现其愿景。

特定领域者

  • SAP再次将其平台从SAP业务对象的预测分析改为简单的预测分析。它仍然是一个小众玩家,因为客户满意度低,缺乏思想共享,工具链碎片化,以及在云技术、深度学习和Python技术上的巨大差距。
  • Angoss在2018年1月被Datawatch收购,但由于收购延迟,该报告收录的仍然是Angoss。Angoss拥有忠实的客户,但仍然是特定领域者,因为它仍然被认为是桌面环境的供应商。
  • Anaconda (新入公司)提供Anaconda Enterprise 5.0产品,这是一个基于交互式笔记本概念的开源开发环境。它还提供了一个软件分发环境,通过它可以访问众多的开源开发环境和开源库。
  • Teradata提供Teradata统一数据体系结构产品,这是一个结合了开源和商业技术来提供分析能力的企业分析生态系统。由于其在数据科学开发方面缺乏凝聚力和易用性,它仍然是一个特定领域者。

市场展望

Gartner预计,未来两到三年内,数据科学和机器学习平台市场将继续出现动荡。全新的厂商,以及来自邻近领域市场的现有厂商(如分析和BI公司),将继续进入该领域。例如,最近一次值得关注的收购案是在2018年1月Datawatch收购Angoss。传统的厂商将努力变得更加敏捷和具有高响应性。我们预计厂商间将进行进一步的收购和扩展,以获得描述性、诊断性、预测性和规范性的分析能力。旨在解决特定的行业问题的应用型的分析解决方案,将继续提供高级的从内到外的全面分析方案。

总结

传统的数据科学和机器学习厂商正受到新进入者以及更小、更灵活的竞争对手的挑战,这些竞争者更容易适应环境,并且随着市场的发展能够更迅速的做出反应。其他供应商也在适应市场需求。例如,Amazon和谷歌正在开发数据科学和机器学习平台。商业软件公司也进入了市场——例如,Salesforce推出的Einstein,Workday收购的Platfora。此外,传统上专注于传统描述性和诊断分析的厂商正在通过技术改进或收购来扩展他们的能力,以提供一系列的分析能力,其中不仅包括描述性分析和诊断分析,还包括预测性和规范性分析。收购能够使厂商增强他们的视野,扩大他们的能力,例如:DataRobot收购的Nutonian, Progress收购DataRPM, TIBCO软件收购Statistica(来自Quest软件的消息)和Alpine Data。

许多组织机构在等待新平台的到来,期望新平台能够帮助扩展现有的基础设施,并与其他现在技术良好融合。用户必须清楚这个市场的快速变化,并了解各厂商和其他组织机构是如何应对这些变化的。他们应该定期评估市场状况并评估当前供应商应对和适应这些变化的能力。此外,他们还应考虑将其分析能力扩展为具有内聚性的描述性、诊断性、预测性和规范性的能力。他们必须熟悉并评估新进入者和颠覆性供应商,以了解这些竞争对手的数据科学和机器学习技术的价值主张。在评估新的厂商和平台时,他们必须评估平台是否与自己已经部署的分析平台存在竞争或互补。此外,考虑从外部服务供应商那里获得帮助也是很好的途径。

随着数据科学和机器学习变得越来越普遍,拥有管理数据和分析数据的企业能力将变得越来越重要。不只是管理能力,在它的整个生命周期中运作和管理数据科学和机器学习模型的能力,在整个分析生命周期中协作和共享的能力,都变得越来越重要。到目前为止,这一领域还没有得到很多关注,但它正变得对组织机构的投资回报率最大化至关重要。

你可以从Domino、H2O.ai、 Alteryx、 Dataiku以及其他上文提到的厂商处下载《Gartner 2018数据科学和机器学习平台的魔力象限》报告。

你也可以阅读一篇相关的报告:《Gartner 2018分析和商业智能平台的魔力象限》报告。

英文原文链接Gainers and Losers in Gartner 2018 Magic Quadrant for Data Science and Machine Learning Platforms


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/jG8XaE7vVb
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/8368
 
549 次点击