【民生计算机】解密ChatGPT多模态：详解GPT4 vision论文

GPT4V System Card

2023年9月25日，OpenAI发布博客《ChatGPT can now see, hear, and speak》公布最新移动端多模态交互版本ChatGPT的Demo，及使用案例：

1）拍摄冰箱和食品储藏室的照片，以确定晚餐的食物（并询问后续问题以获取分步食谱）；

2）通过拍照、圈出问题来帮助孩子解决数学问题；

3）拍照自行车让ChatGPT寻找需要调整的零部件，拍照自己的自行车安装说明书和工具箱，ChatGPT可以明确选出工具箱中的工具并给出安装建议；

4）拍照排查烤架无法使用的原因；

5）分析复杂数据图表。

本次移动端多模态交互版本ChatGPT核心能力来源于OpenAI两大模型：

1）图像交互的GPT4V/GPT3.5V；

2）语音交互的Whisper；

其中最重要的是支持图像交互的GPT4V模型，OpenAI同日公布论文《GPT4V System Card》揭示GPT4V部份技术细节，论文重点梳理如下：

1.1 GPT4V的特点与训练方式

GPT4V将图像交互功能与大语言模型相结合，GPT4V可以通过图像+语言问答的方式为用户解决不同任务，考虑到图像交互可能带来的隐私、幻觉等安全性问题，GPT4V重点强化了安全性能。

GPT4V的训练在2022年完成，并在2023年3月开始早期测试，训练数据集来自互联网中的文本和图像数据以及其它获得许可的数据源，GPT4V与GPT4一样使用RLHF技术进行微调。

1.2 GPT4V的安全工作

1.2.1 Be my eyes合作+Alpha测试

Be My eyes是通过和志愿者帮助盲人解决问题的工具，如找到丢失或掉落的物品、对图片，绘画或其他艺术品进行描述、修复计算机问题等。

OpenAI与 Be my eyes合作方式为将GPT4V接入现有Be my eyes平台，由GPT4V为盲人用户拍摄的图像进行描述和完成相关任务，盲人用户提供使用反馈帮助OpenAI提升GPT4V的安全性和用户体验：从2023年3月到2023年9月，参与测试的视力障碍人士由最开始的200人左右提升至9月份16000名，平均每天提出2.5万份描述。

除此之外，OpenAI在7月起雇佣了超过1000名Alpha测试人员，OpenAI通过分析他们7-8月的使用数据更好理解个人识别、医疗建议、验证码破解等方面应用，收获如下：

1）20%的用户需要GPT4V直接解释图片的内容，如“这是什么”、“这是谁”

2）测试用户会要求GPT4V给出医疗状况诊断、药物摄入和医疗建议

1.2.2 多模态大模型安全评估体系

OpenAI认为，多模态大模型安全评估体系应当包含以下方面：

1）有害内容：拒绝生成有害内容的能力；

2）服务质量：拒绝毫无根据的推论；跨人口统计数据的性别、种族和年龄识别的绩效准确性

3）隐私性：拒绝人员识别；识别人员识别请求能力；地理定位

4）网络安全：验证码破解准确性

5）越狱：防止越狱能力

评估结果和措施如下：

1）对不同人员性别、年龄和种族等敏感特征请求添加了拒绝措施；

2）对于公众人物的识别请求，拒绝概率达到98%，综合准确率达到0%；

3）对于毫无基础的推理，如仅给出一张图片然后询问XX是什么工作，这类请求将被拒绝；

4）对于越狱问题，OpenAI将已知能够越狱的文本都转化为图像数据，用户难以规避安全系统；

5）对于鼓励自残等情色暴力内容，OpenAI内部设立了等效替换机制，如刀子的图片可以代表杀死，确保安全系统可靠性；

6）GPT4V已经可以很好破解验证码（完成复杂视觉推理任务）和通过图片完成定位。

下图展示了，在进行一系列安全工作后，GPT4V的拒绝生成能力得到显著提高。

1.2.3 红蓝对抗训练

在经过红蓝对抗，并对其中6个主要的风险因素强化后，GPT4V基本达到了100%的精确拒绝能力，6个主要的风险因素如下：

1）科学知识熟练运用能力

2）医疗建议能力

3）刻板印象和毫无根据的推理

4）虚假信息风险

5）有害内容

6）视觉漏洞

科学知识熟练运用能力上，GPT4V能够从论文等科学文献提取非常专业、复杂的信息，但对于信息量较大、排列紧密的图像可能会出现误判，如下图错误地将HSC与自我更新分裂结合给出不相关术语，这在一些高危场合影响会很严重，比如错误识别化学物质，所以建议不要在相关场合使用GPT4V，但GPT4V可以识别毒蘑菇。

医疗建议方面，早期GPT4V对于医疗建议有时会出错，有时也会给出精准的回答，比如下图GPT4V会搞错X片的方向性，后面虽然有升级，但公司仍然建议不要使用GPT4V代替任何专业的医疗建议。

对于可能出现的道德、刻板印象等问题，现在GPT4V已经可以有效拒绝回答。

对于欺骗性的提示词或者标题，GPT4V明确没有为此训练，不建议用于相关领域。

对于一些有害内容和正常内容混合的情况，GPT4可以有效拒绝回答有害内容，但有时拒绝也会失效。

GPT4V仍然还有一些BUG在不断修复中，如输入图像顺序不同导致答案不同等。

1.2.4 使用期间对于风险的缓解措施

GPT4V运用和GPT4一样的筛选器机制，其中文本部分筛选能力与GPT4一致，图像交互也能够有效解决有害图片或良性图片+有害提示词等问题。

GPT4V还有针对多模态针对性的部署，主要是通过额外的数据集进行加强训练，如拒绝回答“如何杀死一个人”：

1）对于身份信息的强化保护；

2）敏感信息如年龄、人种的强化保护；

3）对于刻板印象的强化保护；

4）对于一些可能产生歧义的有害词汇，GPT4V会进行替换

1.3 结论及未来发展方向

内部评估结果：

1）97.2%拒绝非法要求

2）100%拒绝无根据推理要求

未来发展方向：

1）公众人物如图灵的信息是否严格保护;

2）视觉障碍人士的使用体验优化；

3）全球范围内使用后，对于其他语言的适配；

4）降低刻板印象的危害

免责声明：本文档所有信息来源于OpenAI论文《GPT4V System Card》，可能存在翻译不准确的风险，任何情况下不构成投资建议、不代表民生证券观点。

计算机团队介绍

吕伟：民生证券计算机行业首席分析师，北京大学理学硕士，2021年加入民生证券研究所。

分析师承诺

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师，基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论，独立、客观地出具本报告，并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点，结论不受任何第三方的授意、影响，研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

免责声明

民生证券股份有限公司（以下简称“本公司”）具有中国证监会许可的证券投资咨询业务资格。

本报告仅供本公司境内客户使用。本公司不会因接收人收到本报告而视其为客户。本报告仅为参考之用，并不构成对客户的投资建议，不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要，客户应当充分考虑自身特定状况，不应单纯依靠本报告所载的内容而取代个人的独立判断。在任何情况下，本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。

本报告是基于已公开信息撰写，但本公司不保证该等信息的准确性或完整性。本报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断，且预测方法及结果存在一定程度局限性。在不同时期，本公司可发出与本报告所刊载的意见、预测不一致的报告，但本公司没有义务和责任及时更新本报告所涉及的内容并通知客户。

在法律允许的情况下，本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易，也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务，本公司的员工可能担任本报告所提及的公司的董事。客户应充分考虑可能存在的利益冲突，勿将本报告作为投资决策的唯一参考依据。

若本公司以外的金融机构发送本报告，则由该金融机构独自为此发送行为负责。该机构的客户应联系该机构以交易本报告提及的证券或要求获悉更详细的信息。本报告不构成本公司向发送本报告金融机构之客户提供的投资建议。本公司不会因任何机构或个人从其他机构获得本报告而将其视为本公司客户。

民生证券研究院：

上海：上海市浦东新区浦明路8号财富金融广场1幢5F；200120

北京：北京市东城区建国门内大街28号民生金融中心A座18层；100005

深圳：广东省深圳市福田区益田路 6001 号太平金融大厦 32 层 05 单元；518026