Py学习  »  机器学习算法

定制芯片行列“新人”:Facebook 自研机器学习芯片,用于内容推荐及视频转码

DeepTech深科技 • 2 年前 • 302 次点击  


近年来,不少科技公司开始自主研发计算机芯片,旨在节省服务器成本,并提高机器学习模型的处理和训练效率。


据悉,Facebook 也加入了这一行列,并正在为其数据中心自主开发一套定制芯片。

其中, 一个芯片处理器用于优化视频转码,或进一步提升其用户观看视频的体验;而另一个芯片处理器将用于内容推荐等机器学习任务。

这样一来,Facebook 将逐渐减少对外部芯片制造商的依赖,比如英特尔、高通和博通等;另一方面,由于Facebook 数据中心的碳足迹处于不断增长的趋势,转向定制芯片可以有效帮助其减少碳足迹。

此外,Facebook 并不打算让自研芯片完全取代原本的芯片处理器 ,新芯片将与其目前正在使用的第三方处理器一起运行。

定制芯片并不是一个新命题,比如,自 2016 年以来,谷歌一直拥有用于机器学习的 TPU (Tensor Processing Unit)定制芯片。该芯片正在为 Google 的许多应用程序提供支持,包括用于提高搜索结果和街景相关性的人工智能系统 RankBrain ,进一步提高了谷歌地图导航的准确性和质量。

值得一提的是,在与围棋世界冠军李世石的对弈中,由 TPU 提供支持的谷歌 DeepMind AI 程序以 4-1 的总比分获胜。


(来源:YouTube 视频截图)

2020 年 12 月,据外媒报道,微软也在为其 Surface 设备和云基础设施开发内部的 ARM 芯片处理器,并开始自研用于数据中心的芯片。

一直以来,微软的 Azure 云服务都是使用英特尔的处理器来驱动。虽然 Surface 设备在 PC 市场中所占的份额相对较小,但微软开始自研芯片的这一举动仍对英特尔造成一定打击,致使其股价在该日收盘前下跌约 6.3%。

Facebook 表示,他们一直在与芯片合作伙伴共同探索提高计算性能和能效水平的方法。关于未来的计划,目前尚未有更多可公布的新讯息。

事实上,对 Facebook 来说,涉足定制芯片并不是一件容易的事,不过此前该公司已经进入半定制芯片领域。


(来源:Pixabay)

2019 年, Facebook 宣布正在开发一种用于视频转码和推理工作的专用集成电路(ASIC)。

据了解,Facebook 每月需为超过 27 亿用户提供应用和服务。为支持如此庞大的用户量,该公司设计并构建了先进且高效的系统来扩展其基础设施。

然而,随着工作负载的增长,仅由传统的通用处理器为用户提供服务已远远不够。在 Facebook 看来,或许只有开发新的专用加速器和整体系统级解决方案,才能进一步提高系统的性能、功率和效率。

因此,Facebook 与其他公司合作开发了分别面向 AI 推理优化、AI 模型培训和视频转码的解决方案。

2019 年 3 月 14 日,Facebook 宣布推出用于AI 模型培训的 “Zion” 平台、用于 AI 推理优化的专用集成电路 “Kings Canyon” 以及用于视频转码的 “Mount Shasta”。

其中,作为 Facebook 的下一代训练硬件平台,“Zion” 平台具有强大的计算能力。在进行 AI 模型培训的过程中,不仅能够有效处理 CNN、LSTM 和 SparseNN 等一系列神经网络,而且可提供高内存容量、高带宽以及灵活的高速互连,以支持 Facebook 的关键工作负载。

需要注意的是,在 Facebook 训练工作负载增加的同时,其推理工作负载也在不断增加。而 Facebook 当前使用的标准 CPU 服务器由于很难继续扩展,因此并不能跟上AI 推理优化的进程。基于此,Facebook 与多个合作伙伴合作开发了可在其基础设施中部署和扩展的推理 ASIC。

据了解,该推理 ASIC 拥有四个主要组成部分,分别为国王峡谷推理 M.2 模块、双湖单路服务器、Glacier Point v2 载卡、优胜美地 v2 机箱。这些组成部分利用已经发布到 OCP(Open Compute Project,开放计算项目) 的现有构建块,加快了开发时间且依靠其通用性降低了风险。


图 | Facebook 用于AI 推理解决方案的构建块(来源:Facebook)

据统计,Facebook 的平均直播数量每年都在翻倍增长。尤其自 2018 年 8 月在全球推出以来,Facebook Watch 服务的月观众人数已超过 4 亿,每天约有 7500 万人使用。

针对观众不同的可用互联网连接,Facebook 生成了多种输出质量和分辨率(或比特率)来优化视频观看,这一过程称为转码。要完成此转码过程需要大量密集型的计算,而通用 CPU 的效率远远不及 Facebook 视频扩展基础设施的增长速率。

因此,Facebook 与其芯片供应商 Broadcom 和 Verisilicon 合作设计了针对转码工作负载进行优化的定制 ASIC。这其中包含用于转码工作流程每个阶段的专用芯片,能够支持分布在不同数据中心位置的异构硬件设备,平衡视频转码的工作负载。

自研芯片的势头正逐渐扩大,整个科技行业的芯片布局是否会因此发生变化?目前仍需继续观望。

-End-

参考:
https://www.theinformation.com/articles/facebook-develops-new-machine-learning-chip
https://www.engadget.com/facebook-custom-server-chip-report-231501934.html
https://engineering.fb.com/2019/03/14/data-center-engineering/accelerating-infrastructure/
https://www.engadget.com/2016-03-14-the-final-lee-sedol-vs-alphago-match-is-about-to-start.html
https://www.engadget.com/microsoft-arm-chips-report-205834114.html


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/119971
 
302 次点击