━━━━
绕地飞行的间谍卫星和其他商业卫星就像一群太空狗仔队,每天拍摄几十太字节的图像。泛滥的卫星图像使美国情报机构陷入了世界上最大的难题——“错失恐惧症”,因为人类分析员只能筛选有限数量的图像,以寻找新的核浓缩设施或运送到不同地点的导弹。因此,美国情报官员发起了人工智能挑战赛,寻找能从卫星图像中自动识别目标对象的人工智能。
自2017年7月份开始,参赛者们就通过世界上最大的卫星图像公开数据集之一来进行机器学习算法训练,数据集中包含100万个带有标记的对象,如建筑、设施等,由美国情报高级计划研究局(IARPA)提供。挑战赛于2017年12月末结束,进入决赛的10个参赛者的人工智能算法成功寻找到隐藏在卫星图像中的数据集。
IARPA发起世界功能性地图挑战赛的目的与美国国家地理空间情报局局长罗伯特•卡迪洛(Robert Cardillo)的说法一致。卡迪洛一直在推动的人工智能解决方案,使目前75%的卫星图像人工分析工作由自动化方式完成。
洛克希德•马丁公司的研究科学家马克•普里特(Mark Pritt)说:“在我看来,这些机构的目的在于自动生成地图,这样就不用有人看着卫星图像说:‘噢,这儿有个烟囱,我来在地图上标记一下。’现在的地图都是人工生成的。”
普里特和他在洛克希德•马丁公司的同事们组建了一个团队,与其他学术团队、政府实验室、私营行业团队一起竞逐总计10万美元的奖金。他们和其他参赛者都希望部署能够在地球图像中辨别特定模式、识别目标对象的深度学习算法。这些图像多是通过卫星、飞机和无人机搭载的遥感技术收集的。
相对于辨识网络上的人脸、地标或物体图像,卫星图像对于深度学习算法而言更难以分辨。卫星图像是多角度拍摄的,在这些图像中,建筑等物体可能上下颠;而且由于云层遮挡,同一地区在不同的时刻呈现的图像也不同。
卫星图像的分辨率也参差不齐,而深度学习算法擅长处理固定尺寸的图像,这使得问题更加复杂。人类工程师不得不进行取舍,是在调整图像大小时丢掉部分细节来降低分辨率,还是仅关注图像局部而对其进行剪裁。此外,许多卫星可以用可见光谱以外的波段拍摄地球图像,涉及红外波段或其他波段的光。
━━━━
在IARPA挑战赛中,个体或团队如果有处理卫星图像的经验,可能会比其他深度学习研究者更有优势。但在现实世界卫星图像不完善的条件下,任何人进行深度学习研究都仍然面临着巨大的障碍。而且专家们一致认为,即便深度学习算法可以达到80%或90%的准确率,也仍然无法单独完成全部工作。笛卡儿实验室的联合创始人兼首席技术官马克•沃伦(Mike Warren)说:“我认为,从目前的技术水平来看,只有人类与机器结合才能真正得到答案。”
笛卡儿实验室作为美国能源部洛杉矶阿拉莫斯国家实验室的分支机构,已经开始将利用深度学习自动分析卫星图片用于商业目的,如预测美国玉米和大豆的收成。沃伦说,这些应用程序代表了“以10%的努力获得80%的成果”的解决方案。
格兰特•斯科特(Grant Scott)是密苏里大学的数据科学家,也是挑战赛中一支参赛团队的负责人,他说,许多公司已经为深度学习和卫星图像开发了很多非常有意思的应用。而相比之下,美国情报机构对于自己的能力和计划都较为低调。但是挑战赛让我们清楚地认识到,这些机构也希望为卫星图像分析工作构建更好的深度学习工具。
IARPA挑战赛的项目经理金载学(Hakjae Kim,音)说:“美国情报机构已经开展了一些项目,但在速度和方法上还有很大的提升空间。”
斯科特和他在密苏里大学的同事们已经在向人们展示,公开的商业卫星图像与开源情报相结合时,可以产生多大的威力。他们在2017年10月份出版的《应用遥感学报》发表了一篇文章,描述了深度学习算法如何在中国一个接近9万平方公里的区域中准确识别已知的地空导弹发射场位置。
经人工核验,他们的最佳算法的正确率达到了98%。该算法仅用42分钟便给出了准确率不低于人工分析的结果,而传统的人工视觉搜索则平均需要60个小时。
这些结果对于IARPA挑战赛来说是个好兆头,同时有助于促进深度学习发展成为一种必要的工具。政府和公司都会继续发射大量的成像卫星,加入到现有的地球观测卫星中。美国商业卫星运营商DigitalGlobe公司作为IARPA挑战赛所用图像的提供方,目前每天拍摄超过70太字节的原始图像。迟早有一天,人类分析师将会需要一切可能的人工智能来帮忙。
作者:Jeremy Hsu
>>>本文为原创,转载请回复。<<<