科学:机器学习研究解锁分子笼的节能潜力
“这些多孔分子固体就像海绵一样,可以区别地吸收气体,”化学工程助理教授,ACS Central Science发表的一项研究的通讯作者Cory Simon说。化学混合物的分离和净化共同造成了全球10%以上的能源消耗。多孔笼分子具有其结构固有的纳米尺寸空腔,并且气体分子通过吸附被吸引并捕获在这些空腔内。
“但是每个笼子比其他笼子更容易吸附某些气体,这种特性可能使笼子更有效地分离气体混合物,”西蒙说。然而,有数以千计的这些笼状分子可以合成 - 甚至可以制造其中一种,并在实验室中测试其性能需要数月,工业中需要数百种不同的化学分离; 因此需要一种计算方法来分类可能性并为手头的工作找到最佳分子。
西蒙利用了这样一种观点,即任何给定空腔的形状都是它最容易吸引的气体分子的原因。西蒙和学生Arni Sturluson,Melanie Huynh和Arthur York采用了一种“无监督”的机器学习方法,根据笼子的形状和吸附特性对笼子分子进行分类和分组。无人监督意味着计算机自己学习形状/属性关系; 没有任何标签来指示它。
“只需向算法显示数据,它就会自动在数据中找到模式结构,”Simon说。研究人员使用了74个实验合成的多孔有机笼分子的训练数据集,每个分子都进行了计算扫描,得到的三维“孔隙度”图像与CT扫描生成的图像相似。“在这些三维图像的基础上,我们从面部识别算法(特征面)中获取灵感,将具有相似形状空腔的笼子组合在一起,”他说。“使用奇异值分解,我们将笼子的三维图像编码成低维向量。”
总结:西蒙用人脸的类比来解释这个过程。“想象一下,你被迫将每个人的脸部映射到二维散点图中的一个点上,同时尽可能多地保留关于面部的信息,”他说。“所以每个面部只用两个数字描述,相似的面部在散点图中靠近分组。基本上,奇异值分解执行这种编码,但对于多孔笼状分子。”该研究表明,所学习的编码捕获了多孔笼腔的显着特征,并且可以预测与腔形状相关的笼的特性。“我们的方法可以应用于学习其他类型的多孔材料和一般分子形状的空洞的潜在表征,”西蒙说。
领取专属 10元无门槛券
私享最新 技术干货