首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat. Commun. | 利用常见的亚结构进行单步反合成预测

今天为大家介绍的是来自微软亚研院Fang Lei研究员的一篇关于回顾合成分析的论文。回顾合成分析是有着众多工业应用的有机化学中的重要任务。先前的机器学习方法利用自然语言处理技术在这个任务中取得了令人期待的结果,通过将反应物分子表示为字符串,然后使用文本生成或机器翻译模型预测反应物分子。传统方法主要依赖于字符串表示中的原子级解码,化学家很难从中获得有用的见解,因为人类专家倾向于通过分析组成分子的亚结构来解释反应。众所周知,某些亚结构在反应中是稳定的并且保持不变的。在文中,作者开发了一个亚结构级别的解码模型,通过完全数据驱动的方法自动提取产品分子中的常见保留部分。作者的模型在先前报道的模型基础上取得了改进,并且证明通过提高这些亚结构的准确性可以进一步提升其性能。

01

人工智能,应该如何测试?(七)大模型客服系统测试

我们在生活中应该多多少少接触过对话机器人,比如我们都知道很多客服其实都是机器人先档在前面回答用户问题的, 有些机器人有相当程度的知识储备, 比如你去买了一辆车, 然后想咨询客服这辆车的保险的细节。 你就会问: 请问车的每年的保险费是多少钱。 但很多时候不同的车型,年份等其他细节会决定了保险费的价格。这时候机器人要通过问询的形式收集这些信息(我们管这些信息叫词槽),所以机器人要先识别用户的意图, 然后识别为了回答这个问题还缺少的哪些关键词槽(就是信息),然后通过反复的询问和澄清收集这些信息后, 才能回答问题。 或者用户向机器人提一个很专业的问题, 比如询问《某个车型如何更换刹车油》,这就要求机器人有相当的知识储备, 很多时候它不能是随便一个搜索引擎搜出来的答案,而是根据客户企业内严格的操作手册提炼而来的。 所以大家知道了吧, 一个企业级的对话机器人不是说随便拿一个类似 GPT 这样的模型扔进去就可以的(GPT 只能当面向 C 端用户来用,企业的对话机器人或者客服机器人必须要有这个企业的专业知识), 所以我们需要有相当的专业领域的知识引擎的构建才可以。

01

每日论文速递 | NLP大佬们联合发文,倡导使用检索增强模型RA-LMs

摘要:参数化语言模型(LMs)通过在大量网络数据上进行训练,展现出了显著的灵活性和能力。然而,它们仍然面临着诸如幻觉、难以适应新数据分布以及缺乏可验证性等实际挑战。在这篇立场论文中,我们主张将检索增强型LMs作为下一代LMs取代参数化LMs。通过在推理过程中结合大规模数据存储,检索增强型LMs可以更加可靠、适应性强,并且具有可归因性。尽管具有潜力,但检索增强型LMs由于几个障碍尚未被广泛采用:具体来说,当前的检索增强型LMs在超出知识密集型任务(如问答)的文本利用方面遇到困难,检索和LM组件之间的互动有限,缺乏用于扩展的基础设施。为了解决这些问题,我们提出了开发通用检索增强型LMs的路线图。这涉及重新考虑数据存储和检索器,探索具有改进的检索器-LM交互的流水线,并且在高效训练和推理的基础设施上进行重大投资。

01

Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!

深圳华大生命科学研究院联合多家机构的研究者们,利用华大堪称“超广角百亿像素生命照相机”的时空组学技术Stereo-seq,首次绘制了四种模式生物胚胎发育或器官的时空图谱,包括和人的基因相似度高达80%的实验室明星小鼠、参与高中课本里著名的摩尔根杂交实验的果蝇、胚胎发育研究的重要模式生物斑马鱼和植物研究的“网红”拟南芥。这是首次从时间和空间维度上对生命发育过程中的基因和细胞变化过程进行超高精度解析,为认知器官结构、生命发育、人类疾病和物种演化提供全新方向。

01
领券