不容错过的2017数据科学15大热门GitHub项目

介绍：

GitHub现在不再仅仅是一个软件寄存管理器，而是软件工程师通过它来共享他们自己开发的工具/库，甚至这些资源对一些公司都很重要。作为一名狂热的数据科学爱好者，我总结了一系列在2017年尤为出名的知识库！

该知识库是NIPS 2017年会议上所有受邀讲座、教程和研讨会的资源和幻灯片清单。NIPS是一个专门针对机器学习和计算神经科学的年度会议。近几年来数据科学界的突破性研究大多是这个研讨会的研究成果，如果你想保持领先的地位，这绝对是最佳的资源！

2.开源软件

2.1 TensorFlow

自TensorFlow正式发布以来，已经有2年的时间了，它一直保持着“机器学习/深度学习”顶级库的称号。Google Brain和TensorFlow背后的社区一直在积极贡献，尤其是在深度学习领域。

TensorFlow最初是作为使用数据流图进行数值计算的库而构建的。但从目前的状况来看，它可以说是建立深度学习模型的完整库。虽然TensorFlow主要支持Python，但它也支持诸如C，C ++，Java等语言。

2.2 TuriCreate-简化的机器学习库

TuriCreate拥有易于使用的创建和部署机器学习模型的复杂任务，如对象检测，活动分类和推荐系统。

TuriCreate是专门为python开发的。TuriCreate提供的最好的功能之一是它可以轻松地将机器学习模型部署到Core ML（苹果的另一个开源软件），用于iOS，macOS，watchOS和tvOS应用。

2.3 OpenPose

OpenPose是一个多人关键点检测库，可帮助你以实时的速度检测图像或视频中某个人的位置。由CMU的感知计算实验室开发，OpenPose的成功证明了开源软件研究如何能够轻松应用在行业中。

OpenPose帮助解决的一个用例是活动检测。例如，由演员完成的活动可以被实时捕获。然后这些关键点和他们的动作可以用来制作动画电影。OpenPose有一个可用于访问库的C ++ API，它也有一个简单的命令行界面来处理图像或视频。

2.4 DeepSpeech

DeepSpeech库是由百度研究开发的语音合成技术的开源技术。它基于TensorFlow，可以专门用于Python，但也可以绑定到NodeJS，也可以在命令行上使用。

Mozilla是从头开始构建DeepSpeech的主要工作人员之一，Mozilla技术战略副总裁Sean White 曾经评价说：“只有少数满足商业质量的语音识别服务可用，主要由几个大公司提供。这项技术减少了初创公司、研究人员甚至更大的公司想要为他们的产品和服务发言的用户选择和可用功能。与社区志同道合的开发人员，公司和研究人员一起，我们已经应用了复杂的机器学习技术和各种各样的创新来构建语音到文本的引擎”

2.5移动深度学习

这个库为移动平台带来了最先进的数据科学技术。该知识库由百度研究开发，旨在将低学习模式部署在Android和IOS等移动设备上，具有低复杂度和高速度的特点。存储库本身中解释的简单用例是对象检测，它可以识别图像中的对象的确切位置。

2.6 Visdom

Visdom是一个支持在协作者之间广播图表、图像和文本的库。你可以以编程方式或通过UI组织可视化空间，为实时数据创建仪表板，检查实验结果或调试实验性代码。

输入到绘图函数中的输入是不同的，尽管其中大多数输入张量X比包含数据和包含可选数据变量（例如标签或时间戳）的（可选的）张量Y作为输入。它支持所有基本绘图类型来创建由Plotly支持的可视化。Visdom在Python中支持Torch和Numpy。

2.7深色照片风格转移

这个库是基于一个研究论文，介绍了一个深度学习的方法将摄影风格转移处理大量的图像内容，同时有效的传递参考风格。该方法成功地在各种情况下产生令人满意的真实感风格的转换，包括一天中的时间，天气，季节和艺术编辑的转移。此代码基于torch。

2.8 CycleGAN

CycleGAN是一个有趣而且功能强大的库，展示了最先进的技术的未来。举个例子，下面的图片是这个库可以做什么的一瞥——调整图像的深度感知。这里的重点是，你没有告诉算法图片中的哪一部分需要重点关注。

这个库目前是用Lua编写的，但是它也可以在命令行中使用。

2.9 Seq2seq

Seq2seq最初是为机器翻译而开发的，但后来被开发用于各种其他任务，包括汇总、会话建模和图像字幕。只要可以将一个格式的输入数据编码成另一个问题，并将其解码为另一种格式，就可以使用这个框架。它使用Python所有流行的Tensorflow库进行编程。

2.10 Pix2code

这是一个非常令人兴奋的项目，它可以使用深度学习，尝试为给定的GUI自动生成代码。在构建网站或移动界面时，前端工程师通常必须编写耗时且无生产力的重复代码。这从本质上阻止了开发人员将大部分时间用于实现正在构建的软件的实际功能和逻辑。Pix2code可以通过自动化过程来弥补这一点。它基于一种新颖的方法，允许从单个GUI屏幕截图生成计算机令牌作为输入。

Pix2code是用python编写的，可用于将手机和网络界面的图像捕获转换为代码。

本文由北阿里云云栖社区组织翻译。

文章原标题《15 Trending Data Science GitHub Repositories you can not miss in 2017》，

作者：Sunil雷，在印度保险行业拥有丰富经验的商业分析和智能专业人士。

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/pIcajx5xF1

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/4853

485 次点击

登录后回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)