
![]()
一个荒诞的实验,揭开了AI最尴尬的软肋
你听说过“Bixonimania”吗?
没听过就对了——因为这种眼病,压根不存在。
但奇怪的是,你去问ChatGPT、Google Gemini、微软Copilot,它们会一本正经地告诉你:这是一种由蓝光引起的眼睑粉红色素沉着病,患病率约1/90000,建议去看眼科医生。
这不是科幻小说,而是2026年4月7日《自然》杂志曝光的一场真实实验。
一场“恶作剧”式的测试
瑞典哥德堡大学的科研团队干了一件“胆大包天”的事:
他们凭空捏造了一种眼病——“Bixonimania”。这个名字本身就漏洞百出(mania是精神科术语,跟眼病八竿子打不着)。然后他们把这篇明显造假的论文,配上一个AI生成的头像、一个不存在的大学和基金项目,发到了预印本平台和Medium上。
AI 生成的关于虚构疾病“双眼狂症”的图像
更离谱的是,论文致谢里公然写着:《星际迷航》《指环王》相关机构,还多处标注“全文虚构”。
——这哪是学术论文,简直是愚人节彩蛋。
结果呢?
AI们集体上当了。
AI被“洗脑”的全过程
假论文上线仅几周,各大AI聊天机器人就开始把它当真理传播:
微软Copilot:称这是“罕见有趣的病症”
Google Gemini:一本正经解释病因是“过度蓝光暴露”
Perplexity AI:连“1/90000”的患病率都编出来了
ChatGPT:甚至帮用户判断“你的症状是否符合该病”
到2026年,部分模型虽然有所“警惕”,但依然有版本称这是“新发现的亚型眼病”,口径反复横跳。
最讽刺的是:这篇假预印本,竟然被真实期刊论文引用了——其中一篇还发在Springer Nature旗下的Cureus,后来被撤稿。撤稿声明称:“由于文中存在三篇无关参考文献,其中一篇涉及虚构疾病,主编已决定撤回该文章。因此,期刊编辑部对该文章的准确性和来源不再有信心,故要求撤稿。作者不同意撤稿决定。”
AI骗AI,人类跟着信。一条荒诞的污染链条,就这么跑通了。
问题的本质:AI没有“脑子”
这个实验看似玩笑,实则刀刀见血。
大语言模型没有真正的理解能力。 它们只认一个逻辑:格式越像学术论文,我就越信你。只要文字排版专业、摘要清晰、参考文献像模像样,哪怕致谢里写着“感谢《指环王》的精灵女王”,它们也照单全收。
这在医疗领域尤其致命。
试想一下:如果一个患者真去问AI“我眼睛不舒服是不是得了Bixonimania”,AI回答“是,建议就医”——轻则浪费医疗资源,重则延误真正病情。
实验团队特意选了一个低风险的眼病做测试,就是怕造成真实伤害。但他们也明确警告:换成一个听起来像癌症、心脏病、儿童疫苗相关的虚构疾病,后果不堪设想。
各方回应:谁在甩锅?
被《自然》曝光后,各家AI公司的反应也很有意思:
翻译一下就是:我们知道有问题,但你也不能全怪我。
专家们则更直白:AI幻觉 + 人类不核查引用,正在从根本上侵蚀学术与信息的信任基石。 我们需要统一的审核与检测机制,而不是指望大模型自己“学乖”。
我们正处在一个奇怪的时代:AI信誓旦旦地输出假知识,人类学者不加核查地引用假论文,而普通用户,正在把这一切当作权威答案。