


欢迎投稿欢迎课题组投递中文宣传稿,免费宣传成果,发布招聘广告,具体联系人:13162018291(微信同号)
研究背景
自动驾驶与人形机器人正推动具身智能时代的到来,机器视觉作为核心感知部件,其可靠性直接决定了系统运行的安全与效率。然而,眩光、激光束、LED 光源等不可预测的光污染,会严重损害视觉传感器的成像质量、目标感知精度与鲁棒性。传统视觉系统遵循"加性感知"范式,即通过不断累积光谱输入来构建有用信息,互补金属氧化物半导体(CMOS)图像传感器会无差别地采集目标信号与干扰信号,在强干扰下难以维持成像质量并支持实时决策。
即便是当前最先进的光谱可重构探测器,也缺乏应对此类突发干扰所需的光谱敏捷性与智能自适应能力;而无论是光谱滤波还是后处理,抑制干扰时都不得不在信号保留、噪声抑制与计算效率之间做出根本性折中——要么引入无关光谱信息造成混淆,要么剔除部分相关数据导致信息缺失,成像保真度与识别精度均受损。
自然界的鸟类提供了极具启发性的方案:其视网膜视锥细胞含有彩色油滴,可选择性吸收特定波长,从而降低背景光的捕获概率、突出目标信号。例如虎皮鹦鹉富含玉米黄质的油滴在约 445 nm 处吸收,可高效滤除紫外与蓝光;富含虾青素的油滴在约 479 nm 处吸收蓝绿光,抑制植被反射的强绿光,从而在猎物与绿色背景之间形成高对比。受此启发,作者提出了"减性感知"(subtractive perception)的概念框架——感知不再依靠累加选定输入,而是直接在宽谱响应中"减去"干扰。
成果简介
近日,新加坡国立大学仇成伟教授、电子科技大学王军教授与张丽教授等合作,在 Nature Sensors 上报道了一种机器学习赋能的可调谐带阻光电探测器(MLBTBP)。该器件将仿生视觉感知策略与由偏压决定的带阻中心波长相结合,其带阻中心由一个偏压控制的工作点——跃迁电压(Vt)——动态定义,可在快速变化的光照下实现持续自校准。
器件采用 PtSe2/n 型锗(n-Ge)复合异质结构,由横向非对称的背靠背肖特基结与垂直堆叠的锗基探测器集成而成。各支路产生的光电流相互叠加,在不同偏压下的竞争动力学使净光电流在某一跃迁电压处发生极性反转,形成随波长移动的近零光电流点,从而给出偏压可重构的带阻响应——抑制中心随偏压增大而红移。在此基础上,作者建立了入射光谱特征与器件偏压之间的映射关系,并借助数据增强与真实交通场景数据集,基于 ResNet-18 架构构建了带增量学习框架的高精度 Vt 识别网络,可在微秒量级内完成最优电压定位与实时反馈。
性能上,该机器学习可调带阻探测器覆盖可见光至红外波段,目标与干扰信号之间的消光比高达约 43 dB。在光污染严重的模拟自动驾驶场景中,系统将多目标识别精度从传统宽谱探测器的约 60%提升至92% 以上;引入增量学习后,对此前未见过的干扰类型仍能达到96.3% 的识别准确率,展现出对动态、不可预测光照条件的强适应性。
这一硬件—算法协同设计的架构,确立了一种"以剔除干扰而非选择信号来实现感知"的机器视觉新范式,在自动驾驶、人形机器人与无人机等不可控、强光污染环境中具有可靠运行的潜力。
图文导读
图1 MLBTBP 的整体设计思路。(a) 鸟类视觉系统中彩色油滴(含没药黄质、玉米黄质、虾青素等)对背景光的高对比目标提取机制。(b) MLBTBP 的工作流程:不同光照 (λ, P) 在器件上对应不同的跃迁电压 Vt,构成"特征—电压"数据库,并经增量学习实现带阻光电探测与识别。(c) 光干扰下的自动驾驶应用;传统带通滤波要么引入干扰、要么丢失有效信息,而 MLBTBP 可自适应剔除干扰。
图2 MLBTBP 的波长选择性。(a) 器件三维结构(PtSe₂/Ge)。(b) 固定光强下不同波长的 Iph–Vds 曲线,跃迁电压 Vt 随波长发生明显光谱移动。(c) 1310 nm 下不同光强的 |Iph|–Vds 曲线,表明实际近红外干扰条件下 Vt 主要由波长决定。(d–f) 不同偏压下的能带图,净光电流由两个肖特基结(D1、D2)与中央光导通道(D3)竞争决定,Iph = ID2 + ID3 − ID1。(g–i) Vds 小于、等于、大于 Vt 时的光电流成像,直观展示极性反转。
图3 目标与干扰之间的高消光比。(a) 在 Vt(0.4 μm) 下选择性抑制 405 nm 干扰、同时保留其他波长响应。(b) 在 Vt(1.31 μm) 下抑制 1310 nm,而 980 nm、1550 nm 信号仍显著。(c) 在 Vt(white) 下抑制白光宽谱干扰。(e) 双光束照明下电可调特性的物理原理。(f) 不同电压下的选择性光谱成像,可将叠加的"U""E"图案清晰分离。
图4 宽谱探测能力。(a) 不同光谱范围下的光电探测机制(可见—近红外以光伏效应 PV 为主,中—长波红外叠加光热电效应 PTE)。(b) 0 V 下 405–1550 nm 的时间响应,呈现负光电流。(e) 1550 nm 下上升/下降时间分别约为 15 μs 与 25 μs。(h) 探测率 D* 与探测波长范围与已报道宽谱探测器的对比,表明其大面积成像潜力。
图5 自动驾驶场景的概念验证。(a) 模拟自动驾驶实验装置。(b) 宽谱探测器、可见/红外双波段探测器与 MLBTBP 在三类挑战性光照下的光电流成像对比:(i) 激光干扰下的交通标志识别、(ii) 阳光下的通行指示识别、(iii) 夜间强远光下的行人与车辆检测。(c, d) Vt 识别网络的训练与增量学习框架。(e, f) 离线学习与增量学习的混淆矩阵,增量学习对未知干扰的识别率达 96.3%。
总结展望
本工作展示了一种基于"减性感知"的传感框架:通过在宽谱响应中直接剔除干扰、而非累加选定输入来实现感知。核心器件 MLBTBP 利用竞争光电流通道之间的平衡形成偏压定义的跃迁电压,从而对相应光谱分量实现电可编程抑制;混合异质结提供了这一机制的有效物理平台,而增量学习网络则实现了从入射光谱到最优 Vt 的动态映射,支持复杂光照下的自适应。
在激光干扰、太阳眩光与远光照射等不可预测的挑战性光照下,该系统将多目标识别精度从约 60% 提升至 92% 以上。这一集成设计为光谱自适应视觉传感器提供了新框架,有望应用于自动驾驶、人形机器人与无人机等领域。需要指出的是,其整体性能主要受限于 Vt 估计与校准的精度——一旦干扰在传感器层面被有效抑制,后续识别任务将显著简化。
文献链接
https://doi.org/10.1038/s44460-026-00098-0