社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  区块链

长铗:区块链与人工智能的交集 |链捕手

链捕手 • 7 年前 • 582 次点击  

现阶段,号称颠覆世界的两项科技正各自面临着难以攻克的问题,一边是随着人类科学技术的提升和生活水平的提高,AI领域的算力矛盾日渐突出;一边是区块链难以落地,仅停留在炒空气币的层面,让从业者焦虑不已。


近日,长铗受邀参加普华资本在杭州举办的「葛岭求真·普华科技私享会」,并发表了《区块链与人工智能的交集》主题演讲,详细讲述了区块链和人工智能之间「你中有我,我中有你」的存在关系。本文经主办方授权链捕手发布,希望能对你有所启发。


01

区块链和人工智能结合是很好的方向


我可能是这个房间里唯一没有人工智能背景的从业者,最近我也在狂补人工智能相关的一些知识。区块链和人工智能是当前两个炙手可热的科技方向,我们从业者怎么看这个行业?外部看起来很热闹,但是我们内心是焦虑的。毕竟区块链不可能永远停留在炒空气。我们一直在思考,区块链什么时候能落地,真正与实体经济结合?


区块链和人工智结合,就是一个很好的方向。


我归纳了一下,区块链和人工智能的结合,基本上可以分成四类。


第一类,通过区块链发Token,然后用这个Token激励社区,这是最简单的结合。


第二类,和智能合约的结合。智能合约是区块链非常重要的一个概念,其实现在看智能合约并不智能,所以有可能就想到用AI的结合,使得合约真正实现智能化。


第三类,和数据的结合。通过区块链这种去中心化的网络来保护数据的隐私。我对这个方向持保留态度,我认为这只能认为是一种分布式账本,数据类的东西其实不适合放在区块链上。


第四类,和计算力的结合。区块链和人工智能最根本的生产力都来自于计算,我认为在计算力这个方向上,二者有融合的曙光。


02

为什么需要计算?


很多朋友问,区块链为什么需要挖矿,毕竟这会造成非常巨大的能源浪费。现在也有很多共识算法,可以不需要挖矿,或者虚拟挖矿,比如内容挖矿或者交易挖矿等等各种各样的创新。但是在我看来,其实不管是怎样的设计,理论上都会牺牲去中心化,这种创新都逃脱不了用人治来代替计算机治理的问题。


Google的一位网络性能工程师IlyaGrigorik写的《最小可行区块链原理》这篇文章非常好,作者用倒推法的方式解释了比特币这种POW机制其实已经是一种最简洁的可行的区块链方案。


比如说现实中两个人的交易,A向B借钱,两个人彼此不信任,需要第三方担保。但是担保人可能会跑路,账本也有可能遗失。这时候就会想到用分布式账本技术来保证交易的安全。采用非对称加密来对对方身份进行确认。


但是这个网络在逐渐扩大,加入了N多个人。他们要共同来保管一份账本怎么办?


这时候就会想到要有共识机制。这个共识机制肯定不能是基于私钥的共识,因为私钥是可以分成无穷多个,也不可能是基于IP的共识。以前有人提出用个人电脑挖矿,认为更去中心化。但是这种空间上的去中心并不是真正的去中心,因为僵尸网络会很容易控制很多台家用电脑,一下子拥有很大的投票权利,就可以控制网络。


所以中本聪给共识引入成本,这个成本就是计算力。这样一来,你投入的计算力越多,在网络中的投票权力就会越大,保护这个网络免受攻击。


这也是为什么会有区块概念,因为打包交易需要付出计算力的成本,单笔交易很难承受打包交易的成本,所以大家有很多笔交易构成一个区块,共同支付矿工手续费,同时区块产生的新币奖励给矿工。


很多其它共识机制,声称不需要投入计算,不需要能源的消费。按照他们的设计,其实不需要有区块这个数据结构,最近出现的一些新型的共识,其实是没有区块的概念,所以能否称之为是区块链,要打一个问号。


还可以用二分法的方式来解释为什么需要挖矿。


其实很简单,现实世界和数字世界存在一种对比的关系,或者叫做镜像关系。现实世界都是随机性的,数字世界都是伪随机的。详细的对比关系这里就不展开介绍了。


区块链其实可以看做是印刷机的逆向机。


这句话不太好理解,当年真格基金徐小平找到我,让我用一句最通俗的话介绍区块链,我说区块链是印刷机的逆向机,在我看来,这种解释已经很清晰了。


印刷机的诞生的意义非常伟大。在印刷机诞生之前,知识和信息都是一种竞争性资源,像圣经、几何原本、武林秘籍等都是手抄本。我拥有,别人就不能再拥有。


但是印刷机诞生以后,知识和信息就变成一种大规模、可复制的非竞争性资源。


互联网其实就是印刷机的加强版,在互联网上一切东西皆可复制。这就造成一个问题,我们很难用互联网方式来处理竞争性资源,现实中资产的转移,其实都是竞争性资源的转移。


当然支付宝也可以实现这种交易,但是支付宝的交易其实是一次数据库操作,数据库操作是不可信的,因为是中心化的架构,所以并不可靠。


为什么早期数字货币的先驱都失败了。他们也是用密码学的方式,因为他们没有找到一个方法,在数字世界中实现竞争性资源的转移。


区块链,首次用互联网的方式,在数字世界中实现竞争性资源的转移。


一笔比特币的交易,跟现实中的原子(实物)的交易是完全一样的。假如我少一个比特币,别人那里肯定会多出一个,而不是一次数据库的操作。


为什么需要挖矿?其实可以这样来理解,在现实世界中,我们要复制一模一样的东西是很困难的。就跟在数字世界中要防止一样东西被复制,也是很困难的。


因其实都是热力学定律。要复制一模一样的东西,按照热力学第三定律,其实可以转述成:你是否可以制造出完美晶体?


要知道,制造出完美晶体,需要达到绝对零度,这要投入巨大的能源消耗。反过来,要在互联网上实现这种竞争性资源的复制一样,要投入计算力的消耗。投入的计算力越高,防止双重支付的壁垒就越高,这也是大家这么信任比特币的一个原因。


我在2014年的时候提出来了「区块链不可能三角理论」。讲的是安全性、效率和去中心化三者之间不能同时共存。


在很多领域都存在不可能三角,比如在分布式计算领域,存在一致性、分区容错性和可用性的不可能三角。在分布式域名领域,存在安全、去中心化和人类可读性的不可能三角。在希尔伯特公理化系统,存在一致性、独立性和可判定性的不可能三角。


其实他们讲的都是一回事。在希尔伯特公理化系统中,一致性表示命题不能相互矛盾,其实对应着安全性。大家共同保存的账本不能互相矛盾,一笔钱在你的账本上已经花出去了,在另一个人的账本上不能还没有花出去。


独立性,讲的是这些公理不能够相互推导出来,其实就是对应着去中心化。去中心化,其实是一种共识的过程,这意味着参与共识的这些节点,有充分的、自由的决策权,而不是像僵尸网络控制的一些节点,空间上看起来更去中心化,但是在的共识的过程当中,它是一致行动人,缺少独立性。


可判定性,指的是不存在一个通用的算法,可以提前验证一个命题是否成立,其实对应着效率。


03

什么是真正的去中心化?


去中心化,其实它是有中心的。


现在很多人批评POW网络,比如存在着算力的集中,芯片生产商的集中,钱包的集中等,这造成了中心化。


其实这种批评并不成立,因为去中心化是一个过程,结果上它是有中心的。去中心化最全面的一个内涵就是这些边缘的节点,有成为中心化节点的权利,也就是说它是一个动态的过程。比如说,现在在算力上排名靠前的矿池,在11年的时候,其实还都是些小角色。所以,这是市场自由竞争的过程,是动态的过程。


去中心化和中心化的区别很大。如果不能区分,很容易被一些概念忽悠,很多区块链认为自己是高TPS,这是一种互联网思维。因为高TPS,肯定是牺牲了去中心化。


最重要一点,去中心化的区块链,它的安全性是一个数学问题,如果变成一个中心化的网络,安全性问题就变成了一种人性问题。


最近我也看到很多一些新的项目,一些新型的共识算法,最终都离不开,比如说一些检验点的介入,分片技术,还有超级节点、领袖节点,不管换什么样的说法,总归来说,这是一种人的共识来代替算法的共识,这就使得区块链网络的去中心化程度会降低。


刚才讲了工作量证明,为什么它的安全性是一个数学问题?


因为要逆转区块链上的交易,这个问题可以简化为「赌徒破产问题」。



假设攻击者拥有了全网算力的10%,我们可以清楚地知道,他追上这个区块的概率是0.0002。


左边的图是追上z个区块的的概率曲线,我们看到,在z=6的时候,它的概率几乎等于0,这也是为什么在比特币的早期,中本聪认为6个区块链交易确认以后,这笔交易就算作是绝对的安全的原因。


如果是POS机制,它实际上是一种虚拟的挖矿,不需要真正的计算,以这个账户中所持有的币天来决定获得利息币的多少。既然是一个人性问题,只能用博弈论分析。



我们认为,POS最终会导致中心化的局面。因为大户持有的币很多,每天获得的利息币就多,会有足够的动力去开客户端。但是小户每天获得的利息币很少,所以他会倾向于关掉客户端。这是一个致命的均衡,最终会落到97/0这样一个均衡当中。


所以它本质上是中心化系统,而且这个中心化,不像比特币所谓的算力的中心化、挖矿的中心化,它们是一种市场的竞争机制,因为新来者可以通过市场的自由竞争来击败原来的领先者。


POS,它不再是一个动态的机制,它是可以理解为一个硬编码系统,权力的分配一开始就写好了,大户只要不卖币,永远在这个网络中有最大的话语权。


04

为什么需要AI POW?


我们为什么要做对人工智能友好型的工作量证明机制?


POW其实是有它的问题的,批评最多的就是说,挖矿造成了巨大的能源和硬件的浪费。但是这个问题不能混为一谈,这其实是两个问题。


第一,能源浪费,我刚刚已经解释了,这个批评是不成立的。因为你投入的能源消耗越多,安全的壁垒就越高,所以能源的浪费其实相当于为区块链内注入负熵。


第二,硬件浪费,这个批评我觉得是成立的。因为比特币的矿机的计算能力很高,但是他不挖矿的时间或者是他被淘汰之后就是一堆废铁,完全没有其他的用途,因为只做哈希运算,应用范围太窄。


所以我们确实会觉得这可能造成了一种计算资源的浪费。


所以我们提出的对人工智能友好型算法,这意味着我们可以直接使用AI的芯片来挖矿。这样的话,我们这些矿机在不挖矿的时候,或者是淘汰了之后还有其他用处。


要完成这样一个创新的目标,我们必须要实现两点:


第一点,对现有的人工智能ASIC型友好。我们认为,人工智能终将进入ASIC时代。第二点,我们必须要采用人工智能运算中最通用、最广泛、最高密度的计算。


首先,来看一下AI运算的需求,非常旺盛。


视频领域,全球每天图像识别需要10个Exa的浮点运算。语音有70个Exa的浮点运算。安防摄像头有210个Exa的浮点运算。加一起,深度学习的计算力需求大概有300个Exa的浮点运算。


可以说,AI领域领最大的矛盾,就是人民群众日益增长的计算需求与落后的计算力的之间的矛盾。


我们为什么认为AI也需要进入ASIC时代?参考比特币硬件的发展历史,用五年时间,就走完了从CPU、GPU、FPGA到ASIC挖矿的整个历程


这一方面是由于比特币巨大的经济刺激,导致硬件的迭代更新特别快,远远超过摩尔定律。



右边这张图是比特币的挖矿难度的增长曲线,在250K个区块链高度之前,比特币的全网算力几乎可以忽略不计的,之后算力开始大幅的增长。在这个时间点上发生了什么事情?就是第一代比特币挖矿ASIC矿机的面世,也就是嘉楠耘智所生产的阿瓦隆矿机。


第二,我们必须要在共识中引入大量的矩阵运算。


我最近看到一个专家批评现在有AI芯片这个说法,他认为不存在真的AI芯片。


他说的好像也有道理,因为人工智能算法是各种各样的,那么不同的算法可能对芯片的要求又不一样,所以不存在一种通用的AI芯片。


但是我觉得,在最底层的层面,他们最终都离不开矩阵运算。最近我看过一篇论文,就是Google TPU论文说,90%以上计算其实都是矩阵运算,还有50%是卷积运算,但卷积运算最终也是要转化成矩阵运算来做。


为什么神经网络效率更高? 我认为就是相当于一种降维攻击,就是用算法来模拟神经网络的多维结构。而且,矩阵运算是非常适合开发ASIC芯片,因为它的运算非常规整,而且可预期。


所以我认为,不管什么样的AI算法,最终都脱离不了矩阵运算。


05

Tensority算法是如何工作的?


比原链采用了对AI友好型的共识算法——Tensority。


比特币的工作量证明机制,非常简单,它其实是用前一个区块的哈希加上1个Nonce,再次哈希之后与预期的难度阈值进行比较,如果达到要求,就完成了工作量的证明。


我们的Tensority算法要复杂一些,除了第一步的种子生成和最后一步的工作量验证和比特币是一样的,中间的过程全部是相应的矩阵运算。


首先我们用前面128个区块的哈希,统一生成种子,这样做对预防51%攻击具有很好的防御性。这一步的过程的话,其实就是为了生成一个随机的矩阵,前面哈希的过程其实都是为了给Scrypt加密算法创造输入的条件。


我们为什么要采用Scrypt算法?这个算法其实是莱特币挖矿的算法对硬件功耗要求不是很高。我们一开始就想到,一定要是一种低功耗的模式,这样的话我们的网络才会更健壮,更去中心化,这意味着理论上所有的AI智能终端都可以参与比原链的挖矿。而且Scrypt算法的安全性在过去几年已经被验证了,从来没有被攻破过。


得到这样一个128B*1024B*32B的矩阵后,再转换成更规整的矩阵,这一步的目的就是为后面的矩阵乘来生成128位的矩阵做一基础。


其实这一步很关键,因为我们的算法90%以上的这个运算都是集中在这一步,所以这一步的的目的也是很明确,就是为了让AI的计算能力得到体现。128位的矩阵相乘之后,得到一个256位的矩阵,最终我们再对这个难度值进行对比,不断迭代,满足条件之后生成一个区块。


06

Tensority算法对AI芯片生态的影响


Tensority算法对AI芯片行业,将会有比较大的影响。


第一,强化了AI芯片的低功耗的设计。


第二,降低了AI芯片的设计风险和回本的周期。这个是很容易理解,现在做深度学习芯片,第一代和第二代可能没什么市场,如果有挖矿保本的需求,设计风险就大大降低了。


第三,促进AI 芯片的普及。这就像现在市面上的显卡矿机对显卡的刺激一样。



右边这张图是英伟达的股票,我认为它的股价很大程度上是由显卡矿工所支撑的。


左边的图是我们国产芯片细分市场的占有率。非常之低,很多领域都是零,最高也就22%,唯独在一个领域的形势比较喜人,就是区块链领域。所以我认为,国产芯片行业通过区块链,实现弯道超车也是有可能的。为什么比特币矿机迭代那么快,就是强大的利益不断驱动创新。


我们认为,将来可能会出现区块链和人工智能通用云。


过去,区块链的计算力很高,但是它的运算不能用于其他用途。相当于一个水池,用隔板隔为两个部分。左边的相当于区块链,水位很高,右边相当于人工智能,水位很低。


现在我们通过这样一个方法,把隔板打通,左边的水位会下降,右边的水位会上升,会形成一个通用云,挖矿设备在闲置的时候,可以做AI运算。AI硬件淘汰之后也可以继续挖矿,大大节约社会成本。


还有一种模式,分布式计算,这个模式已经出现了,有一个自称Airbnb的深度学习项目,收集矿工的算力来提供深度学习服务。它的收益是挖矿的三倍,同时它又给用户提供深度学习服务,收费又是AWS的1/5,所以这确实是一种双赢的局面。


我们还提出了「one camera one vote」,理论上所有具有AI计算能力的摄像头都可以参与比原的挖矿。因为摄像头24小时在线并且联网,数量巨大,空间分布广阔,非常去中心化。


从摄像头的角度来说,会降低自身的硬件部署成本。而且它大部分时候是休眠状态的,只有在有人物活动的时候,它才会被激活。而且我们采用的是一种低功耗的算法设计,摄像头在挖矿的时候只比休眠状态的功耗略微高一点,所以这也是一个双赢的局面。


另外,我们还支持Int数据类型,也是为了让将来几乎所有的AI智能设备都可以参与比原的挖矿。


07

计算即权利


最后是我经常讲的一点:计算即权力。


有人认为人工智能、区块链和大数据这三项新兴技术,分别代表着生产力的变革、生产关系的变革和生产资料的变革。其实他们背后有一样东西就是相通的,就是计算。


我们认为,不仅是在区块链领域、人工智能领域或者在其他领域,谁掌握了计算力,谁就掌握了权力。这代表着一个非常宏大的蓝海市场。


诚挚招聘:链捕手正在招募记者,工作地点在北京东城区。期待有才气、有热情的小伙伴加入我们。如需了解具体的招聘信息,请在后台留言「招聘」。


加入社群:链捕手致力于探索区块链的应用及投资之道,添加小助手微信号:17710514330申请入群,期待与各位行家交流。


值得看看:


特稿:以太坊突围

专访分布式资本沈波:我对区块链的理解与投资原则

专访原海豚浏览器创始人杨永智:我为何在去年就不做区块链了

See Fund 李显冬:详解区块链全行业版图与投资机会

点亮资本郭峰:2018年区块链的5个趋势及其底层逻辑

对话元道:通证(Token)是下一代互联网新经济的关键

孙江涛:投资与孵化一些区块链项目后,我得出了这些实战心得

这是「链捕手」的第86期文章,

欢迎转发朋友圈,转载请务必联系后台,感谢阅读。


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/BlIaT7C3Ge
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/20719
 
582 次点击