前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >日本东北大学李昊:AI催化实验室DigCat平台的预印版发布!

日本东北大学李昊:AI催化实验室DigCat平台的预印版发布!

作者头像
智药邦
发布2025-02-26 14:29:44
发布2025-02-26 14:29:44
1520
举报
文章被收录于专栏:智药邦智药邦

2024年12月6日,日本东北大李昊等人在预印版ChemRxiv上发表论文Digital Catalysis Platform (DigCat): A Gateway to Big Data andAI-Powered Innovations in Catalysis,详细介绍了DigCat平台的核心技术、主要应用和最新进展。

数字催化平台(DigCat)是专为催化材料研究量身定制的大数据与人工智能技术的开创性整合平台。该平台涵盖超过40万条电催化、热催化和光催化实验性能数据,以及30万种催化剂结构。DigCat提供动态数据可视化、精准文献追踪和智能问答助手,并支持云端微动力学建模、机器学习力场训练和回归模型开发等先进工具。此外,平台还配备了基于催化数据与知识的AI驱动聊天机器人。作为全球首个公开发布的全电催化实验数据库和开创性数字催化平台,DigCat为催化领域的发展做出了重要贡献。自2024年1月正式上线以来,截至2024年9月,平台已升级至3.0版本。

访问DigCat请登录:

https://www.digcat.org

引言

数据驱动的AI催化代理(图1)通过整合“大数据平台+AI方法+精准理论建模”,正在彻底改变催化剂的开发流程。这一创新框架通过优化从材料设计到性能评估的全流程,加速高性能、低成本催化剂的发现,显著降低开发成本与时间。

图1 数据驱动的人工智能催化剂,用于催化剂发现

DigCat(数字催化平台)可视为现代AI催化实验室的“大脑”。该平台整合大数据与AI技术,涵盖超过40万条电催化、热催化和光催化实验性能数据,以及30万种催化剂结构。其核心功能包括动态数据可视化、精准文献追踪和智能问答助手。平台还具备先进工具,如云端微动力学建模、基于催化数据与知识的AI聊天机器人、云端机器学习力场训练和回归模型开发。

截至2024年11月29日,DigCat已收录超过40万条实验数据点和33万种理论结构,涵盖多种材料类型。数据库覆盖120余种催化反应(图2)和200多项性能指标,包括氧还原反应(ORR)、析氧反应(OER)、析氢反应(HER)、氨合成、一氧化碳/二氧化碳还原反应(CORR/CO2RR)、过氧化氢合成、臭氧合成、氢与氨氧化、氮与氨氧化、电催化加氢、环氧化物合成、尿素合成、甲醇/乙醇重整制氢,以及多种有机催化反应。这些数据涉及过渡金属及其合金、金属X化物(如金属氧化物、氮化物、碳化物、硫化物和磷化物)、单/多原子催化剂、碳基材料、二维材料和钙钛矿等材料。

图2 DigCat电催化反应类型和材料类型概述

除贵金属等经典催化材料外,截至2024年9月12日,DigCat还收录了文献中最全面的M-N-C电催化剂实验数据,包括新兴非贵金属体系,如单原子/多原子金属团簇掺杂缺陷石墨烯、单原子分子片段催化剂、共价有机框架(COFs)、金属有机框架(MOFs)和金属掺杂石墨相氮化碳(g-C3N4)。

结果与讨论

功能1:实验与结构数据分析及可视化

用户可选择反应类型和材料类型,平台默认以年份为横轴自动显示性能数据(图3a)。通过调整坐标轴类型或输入感兴趣的元素(图3b),用户可轻松实现动态数据可视化。平台还提供分类数据分析功能,例如按测试pH值对实验数据进行分类,并展示不同pH条件下的性能图表(图3c-d)。针对特定需求,滑动条可帮助用户基于反应条件筛选数据,使搜索流程更高效。此外,针对海水电解、磁催化、介导氨合成和介导环氧化等新兴研究方向,平台支持一键筛选相关文献。

图3 DigCat中实验数据的可视化。(a)按年份索引。(b)按元素索引。(c-d)按溶液pH值分类。

DigCat还设有专门的理论结构数据库(图4)。在理论结构数据库界面,用户可选择特定催化反应类型和元素类型,平台将显示相应的结构数量统计与原子数分布(图4a)。通过选择表格中的可视化选项,用户可直接在网页上查看催化剂的3D结构并下载(图4b)。

图4 DigCat中理论结构数据的可视化(a)结构计数和原子数分布的统计。(b)原子结构的可视化和下载界面。

功能2:文献追踪与AI问答

筛选文献后,用户可使用平台的扩展功能,如原文追溯和AI问答。将鼠标悬停在数据点上,可查看催化剂ID和DOI,对话框支持跳转至原文链接。用户还可在线查看实验验证的理论结构,并下载相关计算文件或实验数据,用于构建或验证理论或机器学习模型。AI问答功能允许用户通过输入文献ID,快速检索制备材料、方法、流程及性能分析的详细信息。

功能3:基准分析

DigCat的广泛数据分析为实验标准化与数据可靠性提供了有力支持。通过对比多个研究中常见基准样品的性能,用户可轻松识别数据异常并探究潜在原因。这有助于简化实验流程与数据处理,确保结果更可靠且可重复。

功能4:AI催化科学家

通过将标准化文献数据与大型语言模型结合,DigCat推出了新功能“AI催化科学家”。相较于早期版本和基于PDF文本知识的聊天机器人,集成DigCat结构化数据仓库的新版DigCat-GPT聊天机器人能够为催化领域的专家级问题提供更详细、具体且深刻的解答。此外,DigCat还整合了更多材料数据库作为知识源,包括穆斯堡尔谱数据库、固态无机与有机电解质数据库和热电材料数据库。通过利用大型语言模型匹配这些材料的基础结构与文献需求,AI催化科学家显著拓宽了催化剂预测的潜在材料范围。

功能5:实时生成pH依赖性微动力学火山图

除数据驱动和基于大语言模型的预测外,DigCat平台还提供前沿理论建模工具与机器学习模型训练模块,以增强催化剂材料预测的可靠性。通过pH-电场耦合微动力学建模功能,用户可选择目标反应类型和模型,并输入线性标度关系、电场响应参数、零点能、熵与溶剂化校正、电极电势等关键计算参数,生成精确的催化活性火山图,为实验研究提供更可靠的理论支持。

功能6:实时主动学习训练机器学习力场

DigCat的理论建模能力还包括大量与催化相关的稳定结构模型和过渡态模型,这些是构建机器学习力场的基础。用户可通过输入材料类型、元素类型及是否包含能量、力或压力数据,快速下载这些基础结构。这些模型为机器学习力场训练提供了坚实的数据基础,大幅加速理论建模中的DFT计算。

结论

DigCat平台处于催化研究数字化转型的前沿,为实验与理论数据分析、可视化及AI驱动创新提供全面集成解决方案。其核心功能(如自动3D结构可视化、动态性能分析和AI聊天机器人)使平台适用于各级研究人员。机器学习力场训练和pH依赖性微动力学火山建模等先进工具的整合,进一步提升了其在解决复杂催化挑战中的实用性。“AI催化科学家”的推出标志着重大飞跃,通过结合结构化数据与高级预测能力,提供专家级见解。

展望未来,DigCat计划扩展数据集、优化AI算法,并整合机器人自动化与云端实验等新兴技术。通过促进全球合作与创新,DigCat不仅将重塑催化研究格局,还将为应对能源与环境挑战提供可持续、可扩展的解决方案。该平台充分展示了大数据与AI如何变革科学探索,为材料科学未来开启全新可能。

参考资料:

Di Zhang and Hao Li*, "Digital Catalysis Platform (DigCat): A Gateway to Big Data and AI-Powered Innovations in Catalysis". ChemRxiv, 2024

doi:10.26434/chemrxiv-2024-9lpb9

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档