AI前线一周新闻盘点：谷歌提供免费K80 GPU; AI诊断成功率超过皮肤科医生

作者｜Jack Clark

译者｜核子可乐

编辑｜Natalie，Emily

AI 前线导读：

深度神经网络在甲癣诊断成功率上达到甚至超越大部分皮肤科医生
美国最新发布国防战略备忘录，呼吁政府投资 AI 与机器人技术
Fast.ai 推出微调语言模型，文本分类任务错误率下降约 20%
谷歌 Kaggle 提供免费 K80 GPU 以实现在线编码服务
研究人员提出 SparseNet，能够在不增加大量参数的前提下扩大网络规模
阿里巴巴 AAAI 2018 录用论文：基于对抗学习的众包标注用于中文命名实体识别
中国研究人员公开红外热成像视频数据集，并对 9 款热红外行人追踪（简称 TIR）工具进行评估
OpenAI 将 Kubernetes 扩展至 2500 个节点

以下新闻均来自 Import.AI，内容翻译获得独家授权，未经许可，禁止转载！

AI 击败由 42 名皮肤科医生组成的专家小组，能够更准确地发现特定皮肤疾病症状：

…R-CNN + 大规模数据集超越拥有数百年历史的综合医学教育…

科学家们已经收集到包含大量指甲与趾甲图片的大规模医学级数据集，并利用其训练神经网络，旨在实现高于专家小组的甲癣症状判断能力。该方法采用最初由微软研究小组打造的对象分类器 R-CNN 以及可实现 resnet-152 模型（同样由微软研究小组开发完成）的卷积神经网络。通过这一案例，再次证明至少在认知领域，在拥有充分的数据与计算资源之后，我们将能够立足特定任务设计出足以匹敌甚至超越人类能力的 AI 系统。

数据清洁工作：研究人员们还提供了一套包含近 5 万张指甲图片的数据集供进一步研究使用。这篇论文详细介绍了其如何构建并清洁数据内容，从而实现这套数据集——在过程当中，研究人员训练出一套对象定位系统，从而自动裁剪图片以确保仅保留指甲特征（最初，该网络会错误地将牙齿或疣痣视为指甲）。

结果: 他们以综合性方式测试了具备不同技术的不同人群（包括护士、临床医生乃至皮肤科专家教授等）在诊断能力方面与人工神经网络间的差异。在所有诊断场景下，基于人工智能技术的神经网络都能够达到或者超越大部分医学诊断专家。研究人员们写道，“只有一位皮肤科医生的表现优于利用 A1 数据集训练完成的整体模型，且具体比例仅为三分之一。”

未来前景: 人工智能在医疗用例方面的一大承诺，在于显著降低对特定症状进行初步分析的实际成本。此次实验再次支持了这一观点。除了收集数据集以及开发 AI 技术之外，科学家们还开发出一套基于网络与智能手机的平台，用于对更多医疗数据进行收集以及分类。他们写道，“这项研究的结果表明，本项研究当中开发出的 CNN 与我们开发的智能手机平台很可能在未来的远程医疗环境当中发挥重要作用，而皮肤科医生在这样的环境下则将失去用武之地。”

– 了解更多: 深度神经网络在甲癣诊断工作中达到甚至超越大部分皮肤科医生：利用基于区域的卷积深层神经网络（PLOS One）自动构建甲癣数据集。

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0191493

更多干货内容请关注微信公众号“AI 前线”，（ID：ai-front）

美国国防机构投资 AI 与机器人技术：

…新的国防战略备忘录中提及 AI 技术…

美国最新发布的国防战略备忘录呼吁政府应“广泛加大对自动化、人工智能以及机器学习技术在军事领域内相关应用的投入，同时快速引入各类商业性突破成果。”

此项备忘录还暗示称，人工智能与其它技术可能带来令人不安的负面用途。“安全环境也将受到技术快速发展与战争性质变化的影响。新技术的发展动力将持续存在，并扩展至更多缺少技术背景的操纵者手中以加快其行动速度。此类新型技术包括先进计算、‘大数据’分析、人工智能、自主技术、机器人、定向能量、超音速以及生物技术——这些技术将确保我们能够在未来的战争当中获取胜利。”

– 了解更多: 2018 年美利坚合众国国防战略摘要（PDF 格式）。

https://www.defense.gov/Portals/1/Documents/pubs/2018-National-Defense-Strategy-Summary.pdf

来自 Fast.ai 的可移动语言建模技术：

…校准、校准，还是校准…

Fast.ai 与 Avlient 公司的研究人员们已经公布了其微调语言模型（简称 FitLaM）的更多细节信息。这是一套迁移学习方法，用于对特定领域内的语言模型进行优化。本篇论文与 DeepMind 近期公布的“彩虹”算法类似，双方研究人员在各自领域（分别为语言建模与强化学习）当中皆整合了一系列近期创新成果，从而构建起“以实用性为中心”的模型，从而取得了良好的实际效能。

结果: FitLaM 在五种不同类别的文本分类任务当中创造了新的最高分——而且在大多数数据集中，其错误率下降达 18% 到 24%。

工作原理: FitLaMa 模型由一套 RNN 与个或者多个任务特定线性层构成，此外还包括一项负责在网络较高层级下进行数据操纵的细调技术，旨在保存收集自通用型语言建模的信息。除此之外，作者们还开发出一系列不同技术，希望更进一步促进迁移学习能力，具体请参阅论文原文。

迁移学习: 为了实现迁移学习，研究人员们在一套大型文本语料库上预编了一套语言模型——其实验性示例选择了 Wikitext，其中包含超过 2 万 8 千篇经过预处理的维基百科文章。他们使用的其它技术还包括在重新训练期间对神经网络层进行“梯度解冻”、利用余弦退火进行微调以及使用逆向退火机制。测试领域: 情感分析（两套独立数据集）、问题分类、主题分类（两套数据集）。

– 了解更多: 对语言模型进行微调以实现文本分类 (Arxiv)。 https://arxiv.org/abs/1801.06146

谷歌 Kaggle 添加免费 GPU 以实现在线编码服务：

…提供免费 GPU，且几乎不设任何使用限制…

谷歌公司表示，其实时编码混搭服务 Colaboratory（类似于 Jupyter 记事本加 Google Doc 的组合）的用户将迎来免费 GPU 资源。谷歌公司一位与 Michael Piatek 往来密切的人士表示，用户现在将能够编写代码片段并访问配备有 13 GB 内存的双 vCPU 以及一块英伟达 K80 GPU。

– Access Colaboratory here.

https://colab.research.google.com/notebook#fileId=/v2/external/notebooks/welcome.ipynb&recent=true

先是 ResNets、而后是 DenseNets，现在又有……SparseNets？

…研究人员们以奇异的方式将网络连接起来，希望获得最先进的研发成果…

神经网络可以被看作是一套能够针对不同数据集进行运算的机器，亦可用于发现各数据集间的关联转换方式。研究人员已经开发出多种能够将不同视觉现象内细化特征关联进行转换的方法（Residual Networks 与 DenseNets），同时确保将尽可能多的信息从网络中的一层传播至另一层。

如今，西蒙弗雷泽大学的研究人员们开始尝试从 ResNets 与 DenseNets 当中提取最佳特征，并将其综合至 SparseNets 当中。这是一种更为出色的网络构建方法，能够“聚合前一层的特征，且每一层仅提取与之存在指数偏移的层中的特征……在利用 CIFAR-10 与 CIFAR-100 数据集进行实验测试后，结果显示 SparseNets 能够实现与当前最先进的模型相媲美的效能，且参数数量明显减少。”

低成本网络: 那么，为什么要以这种方式构建网络？具体来讲，如果能够通过这种方式在不增加大量参数的前提下扩大网络规模，那么最终这样的效率优势将可用于构建规模更为庞大的网络体系。SparseNet 在实验当中表明，这样的网络构建方法能够保持与 ResNet 以及 DenseNets 等同的精确度，但参数计算需求却比二者低得多。

– 了解更多: 稀疏关联型卷积网络。https://arxiv.org/abs/1801.05895

利用神经网络提升数据质量：

…中国研究人员尝试利用 AI 扩展数据生成能力…

苏州大学、阿里巴巴集团、深圳高威机器人有限公司以及黑龙江大学的研究人员们已经开发出一套系统，通过生成低质量数据并通过对抗训练提升其质量，从而显著改善中国名称实体识别（简称 NER）技术的成效。NER 系统旨在利用智能系统发现语句中的关键部分，并将其链接至更为宏观的基础知识体系当中。NER 方法的改进将能够被快速转化为面向消费者或面向监控场景的 AI 系统，包括实现个人助理或被用于分析大规模语言数据库。

技术解析: 研究人员们利用外包注释者标记的特定数据集——包括对话及电子商务场景中的数据集，并配合各类基于神经网络的系统以分析各应用内文本样本在不同 NER 标签之间的共性与差异。由此生成的系统将能够以更高的精度实现内容分类，且仍可使用同样的训练数据集，并达到或超越由研究人员创建的其它基准指标。

– 了解更多: 中国利用众包注释信息实现 NER 的对抗性学习 (Arxiv)。https://arxiv.org/abs/1801.05147

中国研究人员收集行人追踪数据集并评估其中九款追踪工具：

…看到你了！就是你，手心出汗那位！…

中国研究人员选择了 60 段利用红外热成像仪拍摄的视频，并将其整理成一套数据集，用以评估热红外行人追踪（简称 TIR）技术的实际成效。

数据集：这 60 条热量序列包含来自各类设备（例如监控摄像机、手持摄像机、车载摄像头以及无人机）的素材，亦可混合不同比例的场景、摄像头位置及视频视角。

追踪工具评估: 研究人员评估了九款采用不同实现方法的行人追踪工具，包括支持向量机、相关性与回归过滤器、深度学习方法（HDT 与 MCFTS）等。SRDC——即空间正则化鉴别相关过滤器——优势明显，其在一系列不同测试当中获得了最为可靠的出色表现。

令人惊讶的强大深度学习表现: 神经网络方法 HDT 与 MCFTS）同样拥有出色的排名。研究人员们写道，“我们建议，如果拥有充足的热成像图片用于训练，那么基于深层特征的追踪工具有可能获得更理想的成效。”

成本高昂: 深度学习方法的实现拥有高昂的成本，其中深度学习系统（HDT 与 MCFTS）在部署于采用英伟达 1080 GPU 与 32 GB 内存的英特尔 PC 上时，帧率分别为每秒 10.60 帧与 4.73 帧。相比之下，SRDCF 对资源的依赖性相对较低，FPS 为 12.29。

– 了解更多: PTB-TIR: 热红外行追踪基准 (Arxiv)。https://arxiv.org/abs/1801.05944

OpenAI 点滴:

将 Kubernetes 扩展至 2500 节点：

探讨我们在扩大自身大规模 AI 基础设施时遇到的一些问题，以及我们所设计的解决办法。

– 了解更多: 将 Kubernetes 扩展至 2500 节点 (OpenAI 博客)。https://blog.openai.com/scaling-kubernetes-to-2500-nodes/

作者 Jack Clark 有话对 AI 前线的读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接：

https://jack-clark.net/

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/gtsEA9ONgd