社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

如何防止数据泄露给ChatGPT?

MarTechCareer • 2 年前 • 225 次点击  

点击[MarTechCareer] → 点击右上角[...] → 点击[设为星标]

第一时间获得最前沿的数据、营销、产品等内容


非所有人都信任OpenAI的ChatGPT。

虽然这种新的人工智能聊天机器人在一些希望实现业务任务自动化的企业中很受欢迎,但银行等其他公司却避免采用ChatGPT,因为他们担心员工在使用聊天机器人时无意中给了聊天机器人专有信息。微软拥有转售该初创公司技术的权利,它制定了一个计划去赢得这些抵制者。


据两位知情人士透露,本季度晚些时候,微软Azure云服务器部门计划销售一个在专用云服务器上运行的ChatGPT版本,该版本的数据将与其他客户的数据分开保存。知情人士说,这样做是为了让客户放心,他们的秘密不会泄露到ChatGPT的主系统。但这是有代价的:其中一位知情人士说,这款产品的成本可能是客户目前使用ChatGPT常规版本的10倍之多。

这位知情人士说,主要来自金融服务行业的少数客户正在测试这款产品。该人士表示,微软销售人员一直在回应金融机构和医疗保健提供商关于使用私人版ChatGPT的询问,并告诉其中一些机构即将推出这样的产品。

微软发言人拒绝置评。

就在微软计划推出私人ChatGPT服务的消息传出几天前,OpenAI曾表示希望向企业出售一款类似的产品,突显了与微软的紧张关系。微软已向OpenAI投资了数十亿美元,并为其支付了巨额云账单。

虽然微软与OpenAI的协议让微软可以分得这家初创公司未来潜在的利润,但这家企业软件巨头更希望企业通过Azure来修复OpenAI,而不是将OpenAI与亚马逊网络服务(Amazon Web Services)等竞争对手的云提供商联合使用。Azure的营收远远落后于AWS,推动它的发展是微软的首要任务之一。

OpenAI已经向一家客户摩根士丹利(Morgan Stanley)出售了一项不涉及微软的私人ChatGPT服务。摩根士丹利的财富管理部门聘请OpenAI为这家投资银行提供运行这家初创公司GPT-4(ChatGPT的机器学习模型)的专用服务器。据此前报道,摩根士丹利随后向该模型提供了数十万份银行市场研究文件,使其成为一个聊天机器人,员工可以用简单的英语询问信息,比如比较房地产投资市场。


摩根士丹利首席分析、创新和数据官Jeff McMillan上个月表示:“我们花了几个月的时间寻找一种不会产生法律和合规问题的用例,因为我们是一家受到严格监管的企业。这是OpenAI生态系统中的一个私人场所,我们把摩根士丹利的知识内容放在这里,没有其他东西。”

从微软购买专用服务器上的ChatGPT访问权限比购买在共享服务器上运行的版本要贵得多。据熟悉计划中的产品的人士透露,微软ChatGPT的常规共享版本每个代币的成本不到一美分——大致代表人工智能生成的答案中的每个单词,而私人版本每个代币的成本可能为几美分。据上周报道,Meta平台最近与微软进行了谈判,希望利用OpenAI的模型开发一款定制的编码工具,但由于价格过高而犹豫不决。


隐私保护

ChatGPT已经引起了消费者和企业的兴趣,因为它可以帮助软件工程师更快地编写代码,自动化客户服务任务,并自动总结会议或演示文稿。

企业对数据泄露的担忧是有根据的。该技术背后的机器学习模型是根据从互联网上抓取的大量文本以及ChatGPT用户在与聊天机器人交谈时输入的信息进行训练的。一些公司认为,在员工不小心将敏感数据分享给ChatGPT后,他们已经蒙受了损失。例如,据《华尔街日报》报道,三星(Samsung)员工在解决问题时将公司源代码粘贴到聊天机器人中,而Verizon和摩根大通(JPMorgan Chase)等公司已经禁止员工使用聊天机器人作为预防措施。


OpenAI的付费客户可以要求不要使用他们的数据来培训和提高ChatGPT的质量,这家初创公司在3月份修改了其隐私政策,默认情况下停止使用客户的数据来培训其软件。但这些措施并没有说服所有客户,尤其是金融或医疗等受到严格监管的行业的客户。据人工智能从业者说,因为OpenAI的机器学习模型不是开源的——他们使用的数据集不是公开的——公司不能确定他们的信息最终不会被用于这些模型的训练。此外,ChatGPT仍有可能在回答问题时泄露公司的私人数据。

MosaicML是一家帮助企业定制人工智能软件的初创公司,其首席执行官Naveen Rao表示:“如果你无法控制模型,信息泄露的可能性总是存在的。”他的公司已经与几家金融公司讨论过使用开源软件而不是OpenAI的版本来构建chatgpt类型的软件,但他表示,OpenAI的模型目前在理解上下文和分析信息方面更为复杂。

微软多年来一直在考虑这些潜在的问题。据此前报道,自2019年与OpenAI达成协议以来,微软员工一直在研究如何提供“保护隐私”的方法来培训这家初创公司的机器学习软件,以便企业能够放心地使用它来完成任务,比如帮助企业员工快速获得对公司业绩的详细分析。其中一种方法是在专用的、隔离的服务器上训练人工智能软件的副本,微软的研究人员发现,这种方法可以防止数据泄露,但与在共享服务器上实施软件相比,运行成本更高。

微软的私人ChatGPT选项是该公司在销售OpenAI软件的同时,试图将自己的服务与OpenAI区分开来的另一种方式。包括银行在内的许多大客户都与Azure签订了现有合同,这可能会让微软在说服他们相信Azure将安全处理他们的数据并遵守当地法规方面占据优势。


ChatGPT的诞生,引发了一波人工智能热潮。而在人工智能中,自然语言处理占据了重要地位。如果你想踏入数据科学领域,就应该准备好掌握你在大学课程中错过的新技能,积极学习自然语言处理等技术,成为一名成功的数据科学家,以满足当前AI行业的最新需求。那么除了大学,还在哪里能学习这些必备技能呢?如果你想系统地学习自然语言处理,了解这项AI技术的更多应用,那千万别错过的MarTechApe携手谷歌美国软件工程师、东南亚独角兽公司Grab的资深数据科学家共同打造的《Python自然语言处理课程》,教你从0到1地学会应用超级广泛的NLP技术!

PYTHON

自然语言处理


课程介绍


1. 来自Google和Grab的课程主讲老师

2. 理论与实践相结合的课程安排

这门课共分6章节,每章节都由理论课程编程实践两部分组成。确保每一位学员可以学以致用、真正理解课堂内容。在完成课程后,学员不仅对自然语言处理有了一定的掌握,同时也熟练运用Python编程语言。

完整的课程大纲


3. 课程适合人群与学员收获

适合人群
  • 想要系统性学习自然语言处理,了解如何应用NLP解决文本分析问题的人
  • 想学习如何用Python做数据科学项目的人
  • 想在数据科学、人工智能等领域,找到职业方向的人
  • 想进入高科技公司的人
  • 虽然从没有过数据科学经验,但是想要用数据科学前沿技术来提升自己工作能力与求职竞争力的人(尤其是,当你的工作需要经常与用户调研、定性研究、文本分析打交道时,NLP可以大大提高你的工作效率!)
  • 在工作/学习中需要与自然语言处理打交道的人(尤其推荐工作中负责AI产品的人来报名课程)
  • 希望从其他行业领域转型到数据科学的人

你将获得
  • 来自Google美国与Grab新加坡的资深数据科学家的一手经验输出
  • 丰富的行业洞察与NLP的实际案例
  • 学习理论的同时,熟练掌握Python并完成NLP文本分析
  • 完成一份自己的NLP语义分析与主题模型
  • 洞悉面试中的NLP真实考题,助力数据科学的求职进程

4. 价格
课程价格:¥399人民币

官网购买通道

还等什么,快来一起走进自然语言处理的世界吧!




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/154398
 
225 次点击