社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

Omar Yaghi #JACS 热文 | ChatGPT化学助手预测MOF合成

ACS美国化学会 • 2 年前 • 318 次点击  

英文原题:ChatGPT Chemistry Assistant for Text Mining and the Prediction of MOF Synthesis

通讯作者:Omar M. Yaghi 加州大学伯克利分校

作者:Zhiling Zheng, Oufan Zhang, Christian Borgs, Jennifer T. Chayes, Omar M. Yaghi*


本文入选 Editors' Choice,可免费阅读全文

以下内容源于 ChatGPT 翻译

01
摘要
Abstract



我们采用提示工程的方法,指导ChatGPT自动从科学文献的不同格式和风格中挖掘金属有机框架(MOF)合成条件的文本。这有效地减轻了ChatGPT产生虚假信息的倾向,这是以前在科学领域使用大型语言模型(LLM)时所面临的挑战。我们的方法涉及开发一个由 ChatGPT 自身编程的工作流程,实现文本挖掘的三个不同过程。所有这些过程都可以在劳动力、速度和准确性之间进行不同权衡的解析、搜索、过滤、分类、总结和数据统一。我们将这一系统应用于从同行评审的研究文章中提取出 26,257 个与约 800 个 MOFs 相关的独特合成参数。这个过程融合了我们的 ChemPrompt 工程策略,指导 ChatGPT 进行文本挖掘,结果显示精确度、召回率和 F1 得分在 90-99% 之间。此外,借助文本挖掘构建的数据集,我们建立了一个机器学习模型,准确率超过 87%,可以预测 MOF 实验结晶结果并初步识别 MOF 结晶中的重要因素。我们还开发了一个可靠的数据驱动 MOF 聊天机器人,可以回答关于化学反应和合成程序的问题。考虑到使用 ChatGPT 可靠地以统一的格式挖掘和整理各种 MOF 合成信息,且只需使用叙事语言,无需编程专业知识,我们预计我们的 ChatGPT 化学助手将在各种化学子学科中非常有用。


Figure. Integrated workflow of the MOF chatbot transforming comprehensive synthesis data sets into contextually accurate dialogue systems and demonstration of a conversation with the data-driven chatbot.


关于 Chatbot 的设置和使用请查阅原文及 Supporting Information


02
总结
Concluding Remarks


我们的研究成功展示了大型语言模型(LLMs),尤其是GPT模型,在化学研究领域的潜力。我们提出了一个包括三种不同但相互关联的文本挖掘方法的 ChatGPT 化学助手,其中包括 ChemPrompt 工程:Process 3 能够进行搜索和过滤,Processes 2 和 3 对合成段落进行分类,Processes 1、2 和 3 能够将合成条件汇总为结构化数据集。在化学文本处理方面,结合互动式提示优化策略,通过三个特定于化学文本处理的基本提示工程原则,ChatGPT 助手显著提升了 MOF 合成文献的提取和分析,其精确度、召回率和 F1 得分均超过 90%。 

我们从合成条件的数据集中阐明了两个关键观点。首先,可以利用这些数据构建预测模型来预测反应结果,从而揭示影响 MOF 结晶过程的关键实验因素。其次,可以创建一个基于文本挖掘的 MOF 聊天机器人,能够提供准确的答案,从而改善对合成数据集的访问并实现从数据到对话的过渡。这项研究说明了 ChatGPT 和其他 LLMs 在概念验证阶段的快速进展潜力。 

在基本层面上,这项研究为与 LLMs 互动以作为化学家的人工智能助手提供了指导,通过最小的先决编程专业知识加速研究,从而更有效地弥合了化学与计算和数据科学领域之间的差距。通过互动和聊天,可以修改代码和实验设计,使数据挖掘民主化,增强了科学研究的领域。我们的工作为进一步探索和应用 LLMs 在各个科学领域奠定了基础,为AI辅助化学研究开辟了新时代的道路。


扫描二维码阅读英文原文

J. Am. Chem. Soc.  2023, ASAP
Publication Date: Publication Date: August 7, 2023
https://doi.org/10.1021/jacs.3c05819
Copyright © 2023 American Chemical Society


关于 JACS

主编Erick Carreira(ETH Zürich


JACS was founded in 1879. It is the flagship journal of the American Chemical Society and the world's preeminent journal in all of chemistry and interfacing areas of science. This periodical is devoted to the publication of fundamental research papers and publishes approximately 19,000 pages of Articles, Communications, and Perspectives a year.

点击“阅读原文”

你“在看”我吗?

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/160346
 
318 次点击