正是由于深度学习遭遇的种种问题,也促使优秀科学家加大了对基础理论的研究。
而另一方面,在部分临床问题中,也可通过在非技术层的行业标准构建等方法,来逐步推动医学影像AI辅助诊断的发展。
第一步,则需定义好要解决的问题。
上海长征医院影像医学与核医学科主任刘士远在2018中国医学人工智能大会的演讲中指出,现在的AI医疗产品遇到的首个问题便是实用性差,如现在常见的影像AI产品大多是基于单病种图像标注形成的模型,尚未符合临床实用场景的产品,而且大多数产品性能的自报数据与实际检测数据不符,鲁棒性有待提高。
AI产品往往只是集中在少数几个病种,难以覆盖全部医学影像问题。
其次,行业现在普遍缺乏标准化高质量的训练数据,国内外虽然有很多公开的数据库,但是存在同质化和人种差异等问题。
而且众多人工智能企业和机构采用的训练数据集标准多样,系统偏差较大,行业缺乏医学图像和疾病征像的统一认识。
整个行业的医疗数据保护和监管措施也有一定的缺失,数据不能被溯源,缺乏合法性和可分享性。
同时业内也缺乏对数据使用标准的判断依据,在现有的法律基础上寻找合规使用和分享数据的渠道,也是迫在眉睫的一件事情。
刘士远建议到,构建标准库,离不开医生的参与。
要形成与AI研发相关的标准和数据,需要在图像采集环节、标准库构建环节、病种的分布以及各种描述术语等层面,都要达成一定的共识。
2018年9月,国家颁布了《国家健康医疗大数据标准、安全和服务管理办法(试行)》。此外,在肺结节领域,中检院肺结节AI检验数据库标定专家组已经完成肺结节标准数据集建设。
这些均为标准的建设,做好了铺垫。
当然,图像标注环节也存在很多问题,以肺结节标注过程为例,其主要存在以下问题:标注者队伍混乱,资质不一;图像征象认识不统一;图像标注方法不统一;图像分割方法不统一;图像量化方法不统一。
据了解,中检院在构建肺结节标准库的过程中,从全国招了250名5年以上经验的影像科医生志愿者,对他们进行了简单的测试,使用了30例结节,结果准确率只有30%,说明如果没有共识和基础培训,医生的标注准确率很低,非影像科医生甚至不是医生的准确率更难以想象。
而标注的方式,有紧密包裹法、区域标注法等,不同的标注方法输出的结果也不尽相同。
“图像分割如果没有统一的标准,结论的差别也会非常巨大。
还有量化的方法,到底是测直径,还是测体积,还是测质量,怎么测,行业都需要形成一致意见。
在医学影像AI模型检测阶段,也会存在生产过程不规范,模型效果和安全性缺乏公正评价,缺乏产品检测标准库和评价体系,缺乏相关法律法规、质控检查和管理制度等问题。
在AI模型使用阶段,受欢迎程度,对医生的影响,过多的假阳性,伦理和法规,是否匹配医院和医生的需求等问题也尚待解决。”
另外,也需考虑其他问题:
产品应游离于信息系统之外,还是融合于信息系统之内?
年轻医生对AI产品产生依赖之后,是否会导致业务能力下降?
数据的伦理和产品的伦理问题:数据的伦理就是数据的所有权、许可权和隐私权都需要制定规范,现在卫计委已经发布了相关标准和规范。第二个则是产品的伦理问题,随着产品的逐渐落地,产品的责任和影响都需要伦理的相关准则来考虑。
刘士远教授还强调,影像诊断是全链条、多维度的工作,工作内容不仅仅是图像识别,需要充分发挥医生在医学影像AI研发过程中的作用。
在数据上,医生可以建立大样本的单病种数据库,提高训练数据质量,并在此基础上规范化标注,形成高质量训练集,还要学会在法律法规下分享和使用数据。
医生还应当成为质量控制和标准的制定者和执行者。如制定图像采集和图像质量的标准,制定数据库建设的构成比例、病种分布、病灶类型等专家共识,并形成各单病种影像征象和描写属于以及单病种AI模型数据标记专家共识。建立一套正确的基本伦理准则来指导AI的设计、管理和应用。