Py学习  »  Git

刚刚,自学3天的阿法元100:0完爆阿法狗,GitHub2017年度报告见证人工智能有多火!

51CTO技术栈 • 6 年前 • 577 次点击  

Nature 今天上线的这篇重磅论文,详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。


2017 人工智能到底有多火

01

人工智能从 0 到 1, 无师自通完爆阿法狗 100-0 

去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。

今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。 


阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。


自学 3 天,就打败了旧版 AlphaGo


人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。


达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。


AlphaGo Zero 与此前版本有明显差别:

AlphaGo-Zero 的训练时间轴

  • AlphaGo Zero 仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。

  • AlphaGo Zero 仅用了单一的神经网络。在此前的版本中,AlphaGo 用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。 而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。

  • AlphaGo Zero 并不使用快速、随机的走子方法。在此前的版本中,AlphaGo 用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本它依靠高质量的神经网络来评估下棋的局势。

AlphaGo 几个版本的排名情况


人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。零基础之上,进而自我训练,实现超越。


通过数百万次自我对弈,AlphaGo Zero 从零开始掌握了围棋,在短短几天内就积累起了人类几千年才有的知识。但它也发现了新的知识,发展出打破常规的策略和新招,与 AlphaGo 在对战李世石和柯洁时创造的那些交相辉映,却又更胜一筹。


这些创造性的时刻给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战 。

尽管才刚刚发展起来,AlphaGo Zero 已经走出了通向上述目标的关键一步。对于希望利用人工智能推动人类社会进步为使命的 DeepMind 来说,围棋并不是 AlphaGo 的终极奥义,他们的目标始终是要利用 AlphaGo 打造通用的、探索宇宙的终极工具。


AlphaGo Zero 的提升,让人们看到了利用人工智能技术改变人类命运的突破性机会。人工智能未来的发展,码农或将大批失业,程序员将成为"驯兽师"。

02

人工智能系统完爆程序员实现真正自主编程

让 AI 自动编程是人工智能领域长久以来的梦想之一。不久前,来自彭博和英特尔实验室的两位研究人员,号称实现了首个能够自动生成完整软件程序的 AI 系统“AI Programmer”。


这个“AI 程序员”利用遗传算法和图灵完备语言,开发的程序理论上能够完成任何类型的任务,AI 自动编程的时代,大幕已开。


这个首个能够自动生成完整软件程序的机器学习(ML)系统,全程只需最低限度的人类参与。以遗传算法(GA)为核心,加上紧密约束的编程语言,将其 ML 搜索空间的开销降到最低。

AI Programmer 的软件架构


从图中可见,由人类驱动的部分非常少,只需要在开始输入指令,最后接收适用于某项任务的函数即可,剩下部分全部由机器完成。


AI Programmer 的新颖部分源于:

  • 独特的系统设计,包括用于效率和安全性的嵌入式手工解释器(hand-crafted interpreter)。

  • 对遗传算法的增强,纳入了指令基因(instruction-gene)随机化绑定,以及编程语言特定的基因组构建及消除技术。


目前这个方面的成果还非常有限,比如让 AI 自动补完编程语言,或者执行简单的加法程序。


研究人员表示,他们用这个系统证明了长久以来的假设,那就是功能完备的程序确实能够被自动生成。


具体到这项工作,AI Programmer 利用机器学习中的遗传算法,模拟复杂的指令。虽然现在 AI Programmer 生成的程序,复杂程度与人类新手程序员编写的结果相当。但研究人员认为,AI Programmer 编写的程序完全可以超越传统范畴,不受人类时间和智慧的局限。


AI 编写的程序只是在测试复杂度和计算资源之间找到了最适合的点。换句话说,可能性无限。


研究人员还表示,我们需要重新思考,设计新的、面向机器的编程语言,因为当前的编程语言是面向人类的,不适用于基于 ML 的编程。“在考虑ML驱动程序生成的未来时,我们需要放弃和重新考虑典型程序语言创建的方法。”


研究人员表示,只有这样做,我们才能开始设想一个由 AI 系统驱动,以人类创造力和设计为指导的计算机软件开发的新未来。

GitHub 2017 年度报告见证人工智能有多火

GitHub Universe 是 GitHub 的年度盛会,今年 10 月10-12 日,GitHub Universe 大会在旧金山召开。同时,GitHub 也在其官网发布了 2017 年年度数据报告 —— GitHub Octoverse 报告。


报告显示,2017 年 GitHub 社区共汇集了 2400 万开发人员,150 万个组织和企业,6700 万个存储库,其中有 2500 万个公共存储库,用户遍布世界 200 多个国家,“全球最大的同性交友网站”实至名归啊!

GitHub 每年都会在年度盛会中推出数据报告,其中列出了一些年度的数据,包括其网站中最受欢迎的编程语言、开源项目等。今年的数据更是让人眼前一亮,Python 这匹编程语言中的黑马,势不可挡!

01

终结语言之争,GitHub 得分最高的语言

编程语言之间的战争是一场持久战,程序员们虽然对于这样的内容有些审美疲劳了,但是每次看到还是疯狂的为自己的应用打 Call。而 GitHub 作为一个丰富的资源库,其中包含有337种独特的编程语言开发的开源项目。


那么,在 GitHub 中哪种语言可以封王呢?JavaScript,你想到了吗?JavaScript 这一年在 GitHub 中共获得 230 万 pull request,比第二名 Python 多了两倍还不止。


Python 今年的请求比去年增加了 40%,成功挤掉 Java 上升为第二位。Typescript 也是今年的黑马语言,它在 GitHub 上的 pull request 比去年多了四倍。

2017 GitHub 上最受欢迎的前 15 门语言


排名前十五的语言(按先后顺序):

  • JavaScript

  • Python

  • Java

  • Ruby

  • PHP

  • C++

  • CSS

  • C#

  • Go

  • C

  • TypeScript

  • Shell

  • Swift

  • Scala

  • Objective-C


从 2017 GitHub 上最受欢迎的前 15 门语言可以看出:JavaScript 稳居第一, 遥遥领先于第二名 Python,这可能和 GitHub 上关于 Web 前端的项目、开发者的数量庞大有一定关系。


值得注意的是:Python 已代替 Java 从去年的第三突进了第二,相比去年它新增了 40% 的 PR 数。


近几年 Python 的增长势头一直非常迅猛,Python 虽然是脚本语言,但容易学,同时,Python 有非常多优秀的深度学习库可用,现在大部分深度学习框架都支持 Python。所以,Python 作为 AI 时代头牌语言的位置基本确立。


再来看看 Java,Java 则被挤到第三位,不过 Java 9 刚发布不久,而且它的模块化特性深受开发者喜爱,霸主地位还是很难撼动的。


同时,我们注意到 Objective-C 排行下降,从中可以看出移动开发的热度在减退。今年提交的 PR 甚至比去年还少不少,而 OC 是 iOS 开发的最主要语言,再联想到 Java 排名的下降,可以看出,移动开发的火热度在下降,而且今年可能是首次下降。


究其本质原因是,智能手机已经越来越普及,当你身边的爷爷奶奶都拥有一部智能手机的时候,那只能说明,智能手机的市场份额已基本到头了。


再加上现在流量基本被一些头部的大厂占领,移动时代的流量获取越来越难,移动创业也就越来越难,自然移动开发的市场需求没法再持续增长了。


不过,移动开发市场没那么火热是事实,但并不意味着移动开发找不到工作,现在稳定发展的公司移动开发岗位是不可或缺的,缺的是真正有能力的人才。


所以,如果你已经在从事移动开发,不必过多焦虑,专注提升自身技术才是王道,而如果你是想学习编程转行的,那么现如今不建议再从 0 学习移动开发了。

02

2017年谁是最赞的开源者?谁是最棒的开源项目?

GitHub 自 2007 年成立,如今已经十年了,如今已经是全球影响力最大、最权威的开源社区了,每年都有大量的企业和个人将自己的项目开源到这里进行交流学习。


那么今年哪些项目最具价值?哪些项目获得了程序员的广泛讨论?哪些项目又收集到了最全的资料呢?

被 fork 最多的前十个项目


TensorFlow 当选第一,TensorFlow 是谷歌的第二代机器学习系统,这也反映了越来越多的人对人工智能感兴趣,并且正在学习准备投入到机器学习当中。


也侧面说明了,现如今,很多开发者还是积极拥抱未来的,因为开源社区,让我们的心态更加开放,也让我们接受、了解、学习新事物的成本低了太多。经历了被称为“人工智能元年”的 2016 年,人工智能在 2017 年也迎来了更大的发展。

贡献者最多的前十个项目


review 最多的前十个项目


discuss 最多的前十个项目


上面四个排行榜,TensorFlow 在其中三个都留下了自己的名字,再一次证明人工智能火热的同时,也从侧面反映了越来越多的开发者对未来人工智能的发展充满信心。

03

2017 年,GitHub 的参与人群出现了新变化

与 2016 年相比,2017 年 GitHub 有了更多的参与者。这些贡献者中接近半数是学生,28% 是专业人士,22% 是编程爱好者。在经验方面,只有 10% 的程序员是有经验的,其中有 45% 的程序员是完全新手。

GitHub 参与人群变化


毫无疑问,开发人员永远都是 GitHub 的核心。2017 年 4 月,GitHub 扩展了其开发者计划,其中 GitHub 的开发人员以及付费用户的开发人员都包括在内。这个计划也使得 GitHub 上的开发人员大涨。

03

2017年 machine-learning 是最被广泛使用的标签

2017 年 GitHub 增加了一个新功能"主题-存储库标签",支持用户通过技术、行业等等搜索项目,那么经过一年的运营,哪些标签成为了 2017 年的主旋律标签呢?


毫无疑问,游戏是 2017 年的大热门,从全民王者荣耀就可见一斑,但"游戏"并不是天下无敌的,至少机器学习就可以和它平分秋色。

被使用最广的标签


以下为标签详情:

● machine-learning:https://github.com/topics/machine-learning

● game:https://github.com/topics/game

● iOS:https://github.com/topics/ios

● API:https://github.com/topics/api

● blog:https://github.com/topics/blog

● website:https://github.com/topics/website

● deep-learning:https://github.com/topics/deep-learning

● library:https://github.com/topics/library

● arduino:https://github.com/topics/arduino

● plugin:https://github.com/topics/plugin

● database:https://github.com/topics/database

● bot:https://github.com/topics/bot


整体数据概述:

  • 2400 万用户

  • 150 万组织

  • 6700 万 Repostitories

  • 130 万学生开发者

  • 用户横跨 200 个国家

  • 四分之一的 GitHub 企业账户来自美国以外的国家

  • 自 2016 年 9 月,公开发表 10 亿 Commit

  • 自 2016 年 9 月,2530 万活跃项目

  • 自 2016 年 9 月,1250 万活跃 Issue

  • 自 2016 年 9 月,新增 670 万开发者

  • 自 2016 年 9 月,新增 45.1 万个组织入驻 GitHub

  • 自 2016 年 9 月,120 万人提交了他们的第一个 Pull Request

  • 自 2016 年 9 月,410 万人创建了他们的第一个 Repo

  • 自 2016 年 9 月,130 万新 Pull Request ,包括 Linus Torvald 的第一个 GitHub Pull Request:https://github.com/Subsurface-divelog/subsurface/pull/155

  • 合并了 100,000,000 次 Pull Request

  • 关闭了 68,800,000 个 Issue

  • 62.4 万 Pull Request 被 review

  • 140 万人在他人的 Issue 下讨论

  • Emoji 表情在 GitHub 上被用得很多

  • 19.1 万人 star 或 fork 了项目但没有提交代码

  • 不包括框架和语言,下面的标签被使用得最多

    • machine-learning

    • game

    • iOS

    • API

    • blog

    • website

    • deep-learning

    • library

    • arduino

    • plugin

    • database

    • bot


最后点有趣的,emoji 表情排行榜,妥妥的排行第一,看来程序员很喜欢相互点赞的呢。

随着社区的不断发展,开源项目的不断增长,GitHub 的报告对于我们对未来的技术趋势判断有很大的参考意义。


互联网行业最怕的是固步自封,不与时俱进,做技术的一样,我们要时刻更新自己,不人云亦云,但是要拥抱变化,只有这样,我们才能在时代的潮流中立于不败。


最后,感谢 GitHub,感谢开源精神,让我们做技术的可以与全世界接轨,更改变了我们学习新事物的方式。感兴趣的不妨点击阅读原文”查看完整报告。

精彩文章推荐:

月入五万却活得像月薪五千,丈母娘们准备好了吗?

高达99.5%准确率,火眼金睛的“鉴黄系统”背后技术大揭秘

风靡全国,日活8000万,《王者荣耀》后台技术架构演进!


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/VKVeVknH96
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/3839
 
577 次点击