首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

物理所推出智能文献推荐与文献管理:从人找文献到文献找人

随着当今学术界产出速度惊人,大量文献如潮水般涌现,研究者想筛选出真正有价值的文献不仅需要技巧和专业知识,包括选择合适的数据库、使用恰当的关键词、设置合理的检索条件等,还需要花费大量的时间和精力进行阅读筛选。导致研究者搜索所需文献的过程愈发变得冗长和难以忍受。对于初学者来说,检索文献更可能是一项困难的任务,因为他们对学术领域的了解有限,面对海量的文献资源往往感到无从下手。同时,凝聚态物理是一个不断发展的学科,未来肯定会有源源不断新的领域出现,传统的机器学习无法满足凝聚态物理不断发展的现实。

针对这一需求,文献推荐功能模块在凝聚态物质科学数据中心(以下简称:数据中心)独立开发的物质科学电子实验室平台(MatElab)正式上线。该模块通过自动化与大语言模型技术,结合有监督学习和零样本学习将最新的论文和专利推送到用户订阅的标签上;实现科研人员从“文献找人到人找文献”的转变,进一步提升科研效率(图1)。

图1 MatElab中文献推荐栏目部署框架

MatElab中的“文献推荐”模块利用微调的大语言模型,通过API接口实时获取最新的期刊论文、专利和会议论文,并精准推送到用户订阅的标签上。用户只需简单订阅自己感兴趣的标签或者提出感兴趣的标签,即可轻松接收最新的文献资讯。这一功能不仅覆盖了物理所关注的凝聚态物理、光学、量子物理、软物质与生物物理、理论和计算物理、材料科学与工程等领域和世界科技前沿,还涵盖了当前热门的量子计算、人工智能、计算机与自动化、能源化学等国家重大需求方向和新质生产力。同时,文献推荐栏目支持零样本学习:即使栏目没有训练的标签,模型也能达到接近有监督微调的准确性(图2)。

图2 MatElab文献推荐栏目中有监督学习、零样本学习的准确性参考图

值得一提的是,除常规搜索方法外,文献推荐模块还可以基于化学元素搜索。在MatElab平台,绝大部分化学式都可以较准确地提取,用户可以根据需要搜索包含La、Ni、O的超导文献,也可以搜索包括Li、Co、O的电池专利(图3),同时这一功能为无机化学后续的标准化规范提供了可能。

图3 MatElab文献推荐栏目中通过化学式搜索文献界面(以超导文献中La-Ni-O为例)

此外,文献推荐栏目支持用户收集整理形成个人文献库。用户可以根据时间范围、期刊和标签等条件筛选合适的文献(图4),通过网页添加或手动上传pdf的方式扩展个人文献库,方便用户管理自己的文献资料,亦可将文献分享给他人,促进学术交流与合作。

图4 个人文献库管理界面

截止2024年9月25日MatElab已有的监督学习和零样本学习的标签请参见下表1和表2:

表1MatElab中包含的有监督学习标签1

表2MatElab中包含的零样本学习标签1

此工作由物理所凝聚态物质科学数据中心组织,博后吴思远负责流程设计和模型的训练,周明波副主任工程师负责与MatElab接口对接,博士研究生朱天念负责pdf文本解析接口对接,清洁能源、超导、理论、非晶、热电等多个实验室的同学参与初期数据标定,拓扑、热电、电镜等实验室参与了零样本学习的测试并提供了标签。

\MatElab“文献推荐”模块的推出,是数据中心在科研信息化领域的一次重要尝试。通过自动化与大语言模型技术的结合,MatElab为科研人员提供了一个高效、便捷、精准的文献获取平台,有助于推动科学研究的进步与发展。未来,MatElab将继续优化和完善其功能,为更多科研人员提供更加优质的服务和支持。

编辑:Chocobo

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O_rPVqw01fpi65aCFFQ7VRBw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券