Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >3.14特别纪念 | π 的第100000000000000···

3.14特别纪念 | π 的第100000000000000···

作者头像
量化投资与机器学习微信公众号
发布于 2020-03-17 01:59:45
发布于 2020-03-17 01:59:45
1.3K0
举报
作者 | Martin

编译 | 1+1=6、Remedios、Axuan

2013

今年的主题是:

π与爱情

▍第一幅

I see a wild civility;—

Do more bewitch me, than when art Is too precise in every part.

每个数字都用不同颜色的点表示。内部的灰点似乎在闪烁——这就是实际的亮度效果。

πi用于表示第i个π的数字。 对应外圆颜色编码第i位,内圆颜色编码第i+1位。相邻位置的内外圆颜色相同。

相邻数字用线条连接:

▍第二幅

设计灵感来自Elena Miska的美丽艾滋病海报。

LOVE IN π—YOU CAN FIND IT HERE

把π计算到13099586位,然后我找到了真爱

对a=0,b=1,…,z=25进行编码,love是数字序列1114214。

该序列首先出现在位置:

13,099,586(…91631111421481873…)

奇怪的是,“恨”(0700194)出现在“爱”之前,排在514,717位。

在前2亿位数中,“恨”出现了23次,是“爱”的6倍。

2014

今年的主题是:

π与折叠路径和频率圈

于那些真正喜欢这种极简主义的人来说, 我们创造了更多复杂但更现代的东西:π频率圈。

但是为了让π的绘制走得更远,我们尝试将它折叠成一条路径,其方法与模拟蛋白质结构折叠的方法相同。研究蛋白质结构的折叠非常活跃——蛋白质的三维结构对其功能而言是必要的。理解它的结构是如何受到底层序列变化的影响, 对于识别细胞中的问题是如何发生的是必要的。

在二维空间折叠蛋白质是一项艰巨的挑战。它是一个NP完备问题,即使路径在网格上实现。我们对寻找能量最优路径进行模拟,最终目标是能够根据蛋白质的序列预测蛋白质的三维结构。图片来自维基百科。(2d折叠,3d形状)

折叠一个数字

使用复制交换蒙特卡罗算法创建折叠路径。

代码地址:http://www.cs.ubc.ca/labs/beta/Projects/REMC-HPPFP/

折叠数字:数字的位数被指定为极性(黑色)或疏水性(红色)。我们搜索能量为-42的路径,表示该路径有42对相邻的7。最大化分配给疏水(红色)状态的邻居数量。在本例中,7s和9s的64位数能量为-42,表明表示路径有42对相邻的7s。

数字(0-9)和状态(极性、疏水性)之间的映射选择是任意的。选择将素数(2,3,5,7 )指定为疏水的。另一种方法可以使用完美正方形(1,2,4,9)。通过将每个数字分配给一个路径节点来构造路径。这样可以把 分成两个(或更多)的数字分组(31,41,59,26, ..)等等。

折叠64位数的:

路径的能量取决于其看上去多难以实现。每次折叠模拟运行时,你都有机会找到更好的解决方案。对于上面显示的64位π我们模拟了500次,发现了200多条具有相同的低能量路径。有趣的是,带有E=-22的路径是在不到1秒的时间内找到的,并且花了大部分时间来找到下一步。

下面按长宽比排序来展示了100条64位数E=-23的路径。

100个最低能量路径|这些是100个64位E= - 23的路径——有更多的能量路径。路径按长宽比(宽度/高度)的增加顺序来进行排列。首先是6x14(0.429), 最后是8x9(0.889 )。(变焦)

模拟64位非常实用-它只需几分钟。在下一节中,我将展示如何运行自己的模拟。

折叠768位数的π——费曼点

让我们折叠更多的位数!768位数怎么样——一直到.99999 。这是著名的π的费曼点。我们在这里看到了第一组连续的6个9。这出人意料地发生得早——在第762位。在这个序列中有298个素数,另外470个是合数。

找到的最好路径是前768位E=-223 (宽度=38,高度= 52,r=0.73, cm=1, cmabs=13 )的π。

选择不强调路径的起点和终点。结束更容易辨认——6 9s很突出。另一方面,找到起点更难。

复数字的π序列中的(d, n)点

费曼点是重复数字的一个特定实例,我称之为(d, n)点。

到达费因曼点的最优路径

下面是我能找到的20条最佳路径的列表。它们的范围从E=- 223到E=- 219。我用一些几何属性来注释每条路径,例如宽度、高度、面积等等。在一些作品中中,这些属性注释路径(能量xxy rcm, cmabs )。

如你所见,路径的尺寸变化很大。低能路径不一定是对称的。小厘米的路径是中心对称的。r≈1的路径被限制在正方形边界内。具有小树突的路径的起点和终点彼此靠得很近。

如果我们不设法进一步推进圆圈,那么作品就不会完整!路径网格是矩形的,但是可以使用以下变换变形为椭圆或圆。

简单地说,每一组同心圆对应一个数字序列π,如3(314 159 265…)或6 (314159 265358…)。给定数字在序列中出现的次数由环的厚度编码。环按其数字的数字顺序向外排列(即内部为0,外部为9)。

对于某些图片,第一个数字(3)与其他组的数字相抵消。寻找的高位数9 s的海报显示π的费曼点(6 9s位数762)。对于显示更多数字的图片,我们试着在组中找到费曼点。

费曼点位于一个非常有趣的位置。如果我们将π分成6组的数字,然后第一个999999正好128组。但是,如果我们把数字按3s分组,那么999和999正好可以分成255和256组(2的幂!),它可以被排列成16 * 16组的平方。

费曼点是数字d连续出现n次的特殊情况。我将其称为(d=7,n=6),并提供前1,000,000位中所有这些点的列表。n值较大的点对它们所属的数字组的频率分布有重要影响。如果将序列划分为多个组,则其影响会更小。

2015

今年的主题是:

π与树状图

▍第一幅

我们从一个正方形开始,逐步划分它。在每一阶段,π的数字用于确定分区中使用了多少行。用于分割线的厚度可以被减薄到更高层次。

这种编码数据的方法称为树状图。通常,它用于编码层次信息,例如硬盘的空间使用情况,其中分区对应于目录中文件的总大小。

上色:

▍第一幅

上面的颜色分配是随机的。对于每种形状,选择给定颜色(透明、白色、黄色、红色、蓝色)的概率是相同的。

形状的颜色选择也会受到相邻形状的颜色的影响。要做到这一点,我们需要创建一个图来捕捉每个层次上所有形状之间的邻接关系。下面将展示π树图的前四层及其邻接图。在每个图中,节点对应一个形状,节点之间的一条边表示形状共享其边缘的一部分。只在角上接触的形状不被认为是相邻的。

2016

Mais laisse-moi tomber, laisse-nous tomber Laisse la nuit trembler en moi Laisse-moi tomber, laisse nous tomber Cette fois

But let me fall, let us fall Let the night tremble in me Let me fall, let us fall This time

今年的主题是:

π与引力波

2016年2月,激光干涉仪引力波天文台(LIGO)首次探测到引力波。

探测器中的信号被声波探测到。通过这个过程,任何数据都可以被编码成声音,从而为我们可能错过的模式和结构提供线索——我们最终听到了两个黑洞的声音。嗡嗡声和唧唧声。

运行模拟重力位,π分配一个质量和允许相互碰撞及轨道。

推导如下:

模拟开始于取n个数字的π并将它们均匀地围绕圆形排列。每个数字的质量di(例如:3)由(1+d)^k给出,其中k是质量幂参数,在0.01到1之间。例如,如果k=0.42,那么3的质量是(1+3)^0.42=1.79。

下图展示了一个n=3,k=1的仿真过程。数字3和4碰撞形成数字3+4=7,然后立即与1碰撞形成数字7+1=8。当系统只剩下一个质量时,模拟停止。

给每个质量加上初速度

当质量具有初始速度时,这些图形很快就变得有趣起来。在上图中,质量以零速度运动。模拟一开始,每个质量立即开始直接向另外两个质量的质心移动。

当初速度为非零时,如下图所示:质量首先以它们的初速度运动,但重力立即施加加速度,改变了这个速度。

15000 步效果:

当以不同的初始条件重复模拟时,结果集称为集合。

下面,重复模拟100次,n=3,k=0.2,每次初始速度略有不同。速度的x、y分量均为正态分布,均值为零,方差固定。这四个系统中的每一个都有其模拟在5,000、7,500、10,000和20,000个时间步长上逐步演化的过程。

k值对仿真结果影响较大。当k很小的时候,所有的数都有相同的质量。例如:当k=0.01时,0的质量是1,9的质量是1.02。

当k很大时,质量的差别就大得多。例如,对于k=2,最轻的质量是(1+0)^2=1,最重的(1+9)^2=10。因为质量的加速度与吸引它的质量成正比,在一对质量中,轻质量会加速得更快。

随着数字数量的增加,折叠的模式不会发生质的变化。

做大量的模拟实验。对于不同的n和k值,重复了几次模拟来采样不同的初始速度。

下面是一个很好的例子,说明了一对质量的稳定轨道模式是如何被另一个质量的存在所破坏的。你可以看到,在左边,一旦淡红色的物质离开了橙/绿,它们就会形成一个稳定的图案。

当数字碰撞时,剩下三个质量,这就离开了系统。它们仍然在彼此的引力影响下,但在模拟期间移动得太快,无法回到画布上。

2017

Well I look at it myself as the beginning, really, of an exploration.

That's the reason we're exploring. You never know what you'll find on an exploration.

What the sky looks like.

What the stars look like.

Will they still twinkle or are they a steady light when you get outside the atmosphere.

As in all things, you must make your own way through life.

—Karminsky Experience Inc.

今年的主题是:

π与星座

THE DIGITS OF π AS A STAR CATALOGUE

π的数字解析为12块。每块中的数字被解释为恒星的(x,y,z)坐标,最后一个数字是恒星Mabs。

通过分析前1200万位数,就得到了100万颗星星。每颗恒星的Mapp由绝对星等计算,天空中的经纬度由直角坐标转换为球坐标。

科普:

绝对星等(Absolute magnitude,M)是假定把恒星放在距地球10秒差距(32.6光年)的地方测得的恒星的亮度,用以区别于视星等(Apparent magnitude,m)。它反映天体的真实发光本领。此方法可把天体的光度在不受距离的影响下,作出客观的比较。如果绝对星等用M表示,视星等用m表示恒星的距离化成秒差距数为r,那么M=m+5-5lgr。

通过从数字序列中减去平均坐标(x和y为4999,z为499),坐标以0为中心。

这颗恒星的绝对星等在-5(最亮)到5(最暗)之间。

所以对于第一颗恒星,它到原点的距离(观察行星的位置):

恒星在宇宙中的位置(x,y,z)被投影到单位球面上,计算它们的经度-180..180和纬度-90..90坐标。

完成这一步后,下一步是找出如何将单位球面投影到页面上。

为了说明每个投影中恒星的排列方式,让我们从一个恒星立方体开始。

为此,我们创建了一个星形目录,它以(0,0,0)为中心填充立方体,边长为10,000。随意将每颗恒星的绝对大小设置为-8,并在此处使用与最终图表中相同的星号编码。

靠近“银河平面”(z坐标接近零)的恒星呈红色。观察行星被旋转,使得这个平面近似于银河系在实际图表中的外观。

在方位角投影中,展示一些相对的半球。北半球地图范围为[- 10,90],南半球地图范围为[- 90,10]。这提供了一些边缘的连续性。靠近半球边缘的明亮的白色圆圈代表天球赤道。

看到落在立方体表面的星星在图表上的位置是很有趣的。这些代表了这个合成宇宙的最远距离。

从一开始就知道星座在星图中扮演着重要的角色。

下面是在天空中绘制某种图案的早期尝试。这些形状并不由什么特别的东西所驱动。

用灭绝的动植物来填充天空:

代码中实现:

图的各个组件用SVG生成,然后导入Illustrator。

2017

And if you've got to sleep a moment on the road I will steer for you And if you want to work the street alone I'll disappear for you —Leonard Cohen (I'm Your Man)

今年的主题是:

π与全世界的街道

十字路口的街道段由折线表示,折线在十字路口被中断、拼接,以达到合5-10米的分辨率。

图像中共有108,366,429 条折线,总跨度大约 39,930,000 千米。

提取城市信息

我们从数据集中选择44个城市并用一个以经度和纬度为坐标的0.6*0.6度的方形图块作为样本。这个方块大概对应于一个65 km × 65 km的方形。

这些城市的中心坐标可能和权威坐标有所不同,使用谷歌地图在我们认为是有用的中心的地方确定中心坐标来对街道作为样本。下面这些坐标与导出的折线对应。

每个城市的道路坐标然后通过等距株环状投影图被转化,使得经线之间的距离与纬度之间的距离相等。这由以下过程实现:

其中ϕ是纬度,λ是经度。平均是对于所提取的整个城市的道路区块而言的。以下所有步骤将使用这些转换后的坐标。

让我们来看一个城市,以哥本哈根为例,建立一些对于数据集的印象。

在下面这个放大后的部分图片中,你可以看到这些十字路口(交点)和与交点连接的每一条折线。

进一步放大,你可以看到克里斯蒂安堡宫,丹麦的宫殿之一,并且是丹麦国会的所在地。

创建城市条带

城市条带由对于0.015度*0.015度(转化后的经纬度)的图块取样得到。这个大小大约是1.7千米的方形。

对于条带中的每一个地点,仅当折线的数量在40d≤N<40(d+1)−140d≤N<40(d+1)−1(d是π的数字)之间时,图块以π的数字为顺序被取样。有d=9 的图块仅需要有 360≤N 条折线。

举个例子,第一个图块被对应到 d=3,这必须有120≤N<159条折线,第二个图块被取样以满足密度40≤N<79,因为它与π的下一个数字d=1相关联。

进行进一步对可以接受的图块的选择,使得街道与前一图块相连接。进行极小的城市调整和缝合来尽量实现无缝连接。

下面是一个城市条带集合的例子,城市包括:阿姆斯特丹,曼谷,北京,柏林,哥本哈根,爱丁堡,中国香港,约翰内斯堡,马拉喀什和墨尔本。

在含π的十个数字的道路上,莫斯科、孟买、内罗毕、新德里、尼斯、布拉格、罗马、斯德哥尔摩、温哥华和华沙的城市条带。

下面放大了以上尝试条带的一部分来展示缝合的结果,每个街道区块在蓝色方框中被标出。

有些区块非常有趣,比如,最下面的条带的第四个区块(是哥本哈根)没有道路横穿区块。

创建世界图块

时间区块是城市条带的二维版本,但是使用了二个及以上的城市。

区块基于π的数字的顺序从城市取样,在6*6的网格上排列。举个例子,第一行的区块对应于314159,第二行对应于265358。每个数字都被分配给一个城市,对应的区块被从对应的城市取样。

对于城市条带,仅当他们与前一区块排列时,区块被选择。这在二维中的实现更具技巧性因为他们必须将一个已选择的区块与其他最多两个已放好的区块匹配。

不像城市条带,在街道密度中不进行选择。

下面是一个使用以下数字对应的城市的世界图块:0:阿姆斯特丹,1:多哈,2:马拉喀什,3:孟买,4:内罗毕,5:罗马,6:旧金山,7:首尔,8:上海,9:温哥华。

在含π的十个数字的道路上,含阿姆斯特丹、多哈、马拉喀什、孟买、内罗毕、罗马、旧金山、首尔、上海和温哥华的世界区块。

下面在图片中央放大区块,然后展示区块取样的城市。

2019

How many ages hence Shall this our lofty scene be acted over In states unborn and accents yet unknown! —Willian Shakespeare (Julius Caesar, Act III, Scene 1)

2019的主题是:

π与排版

海报自动生成,并进行了一些优化,以避免换行、平衡页面上的不同字母、单词长度、特定的数字结尾等等。

你可以用不同的语言下载数字列表0到9。

下载编号词表:http://mkweb.bcgsc.ca/pi/piday2019/numbers.in.languages.tsv

下面是每张海报的数字和单词列表。

▍第一幅

▍儿童版

102种语言

2020

‍‍‍‍3 Little π

1 what

4 can you tell us?‍‍

今年的主题是:

π与诗意

由于今年新冠肺炎的影响,今年π日庆祝活动是短暂的诗意散发,称之为piku。

π的诗意

3 A Three and

1 a

4 one and a four.

或者:

1 Dust

4 in space vacuum

0

3 clogs alien

2 machines.

0

2 Bummer.

0

这些都是nku。就像俳句,是一种结构(行数和音节数)受限于数字的诗歌。

给大家讲一下nku:

俳句,是日本的一种古典短诗,由“五-七-五”,共十七字音组成;以三句十七音为一首,首句五音,次句七音,末句五音。要求严格,受“季语”的限制。

俳句是中国古代汉诗的绝句这种诗歌形式经过日本化发展而来。同时在日本以每日小诗的形式发展。

上面的第一首诗是一个piku(π kuパイク),基于π的前三个数字。上面的第二首诗是nku今年的日期14032020

最简单的nku是一首三句诗,分别有3、1和4个音节。

3 Three one four

1 One

4 Five nine two six.

具体来说,俳句计算音标发音的数量,并不总是相同的音节。 例如,any这个词有两个发音:a-ny。

如果你对如何用日语计数声音感兴趣,可以阅读标记时间和俳句。

http://www.tempslibres.org/tl/en/theo/mode04.html

当然,可以使用较长的单词,但要注意那些只需要一个音节的句子。

3 Numbers are

1 all

4 Equally fun.

3 Land meets sky.

1 Oh

4 It's you again!

你可以使用连字符来计算音节数:

3 Memories

1 for

4 get yourself then.

PIKU的复数形式是PIKU

Piku是singulare tantum :数形式与单数形式相同。这是因为它的灵感来自俳句,在日语名词中没有不同的单复数形式。

3 Piku is

1 the

4 piku plural.

一般来说,一个piku可能有超过3行。 这反映了这样一个事实,即数字的结尾不会终止。

3 Land meets sky.

1 Oh,

4 It's you again!

1 Yes,

5 Who did you expect?

0的处理

数字0是没有音节的一行,相当于一个必修的诗句休止符。 但是因为第一个零在π的33处,所以有一段时间你不会看到一个句子中断。

因此,你可以自由地在piku中任何地方引入一个诗行分句,比如说:

3 Hot air breeze

1 cools

4 much hotter things.

3 F 0 0

1 red

4 You add the light.

来,我们自己写一个:

3 piku are

1 not

4 hard to write but

1 good

5 ones are not easy.

大家也可以写一首留言哦!

心系武汉

等疫情结束,花枝春满。

山河无恙,人间皆安。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
3.14的艺术:π的第100000000000000···
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者” 量化投资与机器学习公众号独家奉献 作者 | Martin     编辑 | QIML 3月14日 π 科学与艺术的结合 这几年的主题很精彩 请耐心往后看哦! 2019年11月26日,联合国教科文组织第四十届大会正式宣布
量化投资与机器学习微信公众号
2022/03/15
1K0
填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
世界是变化的,分子是运动的,从预测静态单一结构走向动态构象分布是揭示蛋白质等生物分子功能的重要一步。探索蛋白质的构象分布,能帮助理解蛋白质与其他分子相互作用的生物过程;识别蛋白质表面下的潜在药物位点,描绘各个亚稳态之间的过渡路径,有助于研究人员设计出具有更强特异性和效力的目标抑制剂和治疗药物。但传统的分子动力学模拟方法昂贵且耗时,难以跨越长的时间尺度,从而观察到重要的生物过程。
用户9861443
2024/05/30
1480
填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
卡内基梅隆大学提出SurfPro模型,通过表面特征进行蛋白质设计
设计具有期望生化特性和功能的蛋白质,是当前人工智能在生命科学领域最引人注目的应用之一。然而,现有的研究大多数是从蛋白质序列或结构特征出发进行蛋白质设计,而没有考虑到蛋白质分子表面在各种生化过程中所起的重要作用。实际上,分子表面决定了蛋白质在三维欧几里得空间中的形状和生化性质,如疏水性、电荷和极性等等。表面形状和相关的生化特性共同决定了潜在的蛋白质功能。给定具有几何和生化特性约束的所需表面,如何生成适合表面的蛋白质序列,仍是一个未被充分探索的领域。
智药邦
2024/07/06
3190
卡内基梅隆大学提出SurfPro模型,通过表面特征进行蛋白质设计
J Med Chem|静电互补在基于结构的药物设计中的应用
2022年5月5日,Astex Pharmaceuticals的科学家们在J Med Chem杂志上对静电势计算在药物设计中的应用进行了综述,并且利用6个具体的例子阐明了ESP计算对于基于结构的药物设计的改善和指导意义。还推荐了该公司研发的一款基于AI的快速ESP计算工具:GC-DNN,该工具在精度上可以媲美DFT方法计算的ESP结果。
智药邦
2022/11/16
1.5K0
J Med Chem|静电互补在基于结构的药物设计中的应用
AlphaFold、人工智能(AI)和蛋白变构
AlphaFold 闯入了我们的生活。一种强大的算法,强调了生物序列数据和人工智能(AI))的力量。AlphaFold有附加的项目和研究方向。一直在创建的数据库承诺了无数的应用程序,这些应用程序具有巨大的潜在影响,但仍然难以推测。人工智能方法可以彻底改变个性化治疗并带来更明智的临床试验。他们承诺在重塑和改进药物发现策略、选择和优先考虑药物靶点组合方面取得巨大飞跃。研究人员简要概述了结构生物学中的人工智能,包括分子动力学模拟和预测微生物群与人类蛋白质之间的相互作用。研究人员强调了由深度学习驱动的AlphaFold在蛋白质结构预测方面所取得的进步及其对生命科学的强大影响。同时,AlphaFold 并没有解决长达数十年的蛋白质折叠挑战,也没有识别折叠途径。AlphaFold提供的模型没有捕捉到像折叠和变构这样的构象机制,而这些机制植根于系综中,并由其动态分布控制。变构和信号是群体的特性。AlphaFold 也不会生成本质上无序的蛋白质和区域的系综,而是通过它们的低结构概率来描述它们。由于 AlphaFold生成单级结构,而不是构象系综,它无法阐明变构激活驱动热点突变或变构耐药的机制。然而,通过捕获关键特征,深度学习技术可以使用单一预测构象作为生成多样化系综的基础。
DrugAI
2022/11/28
7130
AlphaFold、人工智能(AI)和蛋白变构
Nature|仅根据靶点结构设计蛋白质的结合蛋白
2022年3月24日,华盛顿大学蛋白设计研究所的David Baker、曹龙兴(同时在西湖大学)和Brian Coventry等人在Nature发表文章,介绍了一种仅根据靶点蛋白的结构信息就可以进行蛋白质从头设计的方法,该方法可以对治疗和诊断中各种蛋白质上的位点进行针对性的设计,具有广泛的用途。
智药邦
2022/04/13
2.3K0
Nature|仅根据靶点结构设计蛋白质的结合蛋白
ICML 2024 | 通过力引导的SE(3)扩散模型生成蛋白质构象
今天为大家介绍的是来自字节跳动Quanquan Gu团队的一篇论文。蛋白质的构象景观对于理解其在复杂生物过程中的功能至关重要。传统的基于物理的计算方法,如分子动力学(MD)模拟,存在罕见事件采样和长时间平衡问题,限制了它们在一般蛋白质系统中的应用。最近,深度生成建模技术,特别是扩散模型,已被用于生成新颖的蛋白质构象。然而,现有的基于评分的扩散方法无法正确结合重要的物理先验知识来指导生成过程,导致采样的蛋白质构象与平衡分布存在较大偏差。为了解决这些问题,本文提出了一种用于蛋白质构象生成的力引导SE(3)扩散模型——CONFDIFF。通过将力引导网络与基于数据的评分模型混合,CONFDIFF可以生成具有丰富多样性且保持高保真的蛋白质构象。在包括12种快速折叠蛋白质和牛胰岛素抑制剂(BPTI)在内的多种蛋白质构象预测任务上的实验表明,作者的方法优于当前最先进的方法。
DrugAI
2024/07/05
4000
ICML 2024 | 通过力引导的SE(3)扩散模型生成蛋白质构象
arXiv|字节跳动通过力引导的SE(3)扩散模型生成蛋白质构象
蛋白质的构象景观对于理解它们在复杂生物过程中的功能至关重要。传统的基于物理的计算方法,如分子动力学(MD)模拟,存在罕见事件采样和长平衡时间的问题,阻碍了其在一般蛋白质建模中的应用。近年来,深度生成模型技术,特别是扩散模型,已被用于生成新的蛋白质构象。然而,现有的基于分数的扩散模型方法不能适当地纳入重要的物理先验知识来引导生成过程,导致采样的蛋白质构象与平衡分布之间存在较大偏差。
智药邦
2024/06/11
2480
arXiv|字节跳动通过力引导的SE(3)扩散模型生成蛋白质构象
Cell Systems | 深度学习开启蛋白质设计新时代
今天为大家介绍的是来自Bruno Correia团队的一篇综述。深度学习领域的迅速进步对蛋白质设计产生了显著影响。最近,深度学习方法在蛋白质结构预测方面取得了重大突破,使我们能够得到数百万种蛋白质的高质量模型。结合用于生成建模和序列分析的新型架构,这些方法在过去几年里显著地革新了蛋白质设计领域,提高了识别新蛋白质序列和结构的准确性和能力。深度神经网络现在能够学习和提取蛋白质结构的基本特征,预测它们与其他生物分子的相互作用,并且有潜力创造用于治疗疾病的新有效药物。
DrugAI
2023/12/19
5190
Cell Systems | 深度学习开启蛋白质设计新时代
AI 正在引领一场新型科学革命
作者 | Bryan McMahon 编译 | bluemin 编辑 | 陈彩娴 自20世纪50年代DNA被发现以来,生物学家一直试图将基因序列的长度与一系列细胞成分和蛋白质合成过程联系起来,例如,包括为现在著名的mRNA疫苗助力的特定抗体的mRNA转录过程。 尽管自DNA发现以来,在基因组测序和理解方面取得了一定进展,但仍缺失一个重要环节。生物学家缺乏一种仅使用未知蛋白质的DNA或RNA源序列就能准确有效地预测其三维形状的方法。在生物学中,结构决定功能。蛋白质在细胞中的作用取决于其形态。中空的圆柱形结构有
AI科技评论
2022/06/20
2400
AI 正在引领一场新型科学革命
腾讯团队提出Interformer模型,通过相互作用感知进行蛋白质-配体对接亲和力预测
近年来,深度学习模型在蛋白质-配体对接和亲和力预测中的应用引起了越来越多的关注,这种应用对于基于结构的药物设计至关重要。然而,许多这些模型忽略了复合物中配体和蛋白质原子之间相互作用的复杂建模,从而限制了它们的泛化和可解释性的能力。
智药邦
2024/12/23
4120
腾讯团队提出Interformer模型,通过相互作用感知进行蛋白质-配体对接亲和力预测
【蛋白设计】Anchor extension:一种结构导向方法设计靶向酶活性位点环肽
美国华盛顿大学的David Baker教授研究组的Parisa Hosseinzadeh开发了一种新型的基于结构从头设计环状多肽的通用方法,该方法利用了已知与感兴趣的靶表面结合的分子中的官能团作为锚,使用Rosetta软件中的广义运动闭环方法围绕该官能团构建环肽。成功设计出高活性的环肽结合剂。相关工作于2021年6月7日发表在Nature communications期刊上,名为“Anchor extension: a structure-guided approach to design cyclic peptides targeting enzyme active sites”。他们将这种设计方法命名为“anchor extension”。并使用该方法设计出针对组蛋白去乙酰化酶(HDAC2和HDAC6) 设计了IC50为9.1nM以及4.4nM的两个高活性环肽分子,相对原始的化合物分子活性提高了近1000倍。
DrugScience
2021/09/22
9810
【蛋白设计】Anchor extension:一种结构导向方法设计靶向酶活性位点环肽
RaptorX、AlphaFold、DeepAccNet、ESMFold…你都掌握了吗?一文总结生物制药必备经典模型(一)
本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
机器之心
2023/08/07
1.1K0
RaptorX、AlphaFold、DeepAccNet、ESMFold…你都掌握了吗?一文总结生物制药必备经典模型(一)
ACS Nano | 基于计算机的抗菌肽发现框架
抗生素耐药性,是人类社会中最严重的医疗问题之一,目前每年在欧洲造成超过2.5万人死亡,在美国造成3.5万人死亡。几十年来,具有抗菌素耐药性的微生物数量一直在增加。这些微生物引起的感染缺乏有效的治疗方案。在过去几十年里,人们发现抗生素缺乏,严重影响了经济和人类的福祉。因此,当前重要的是,人类必须开发出能够对抗耐多药微生物,并减缓抗生素耐药性的进化和传播的抗菌素。
DrugScience
2021/03/18
1.1K0
ACS Nano | 基于计算机的抗菌肽发现框架
一篇综述一个领域|在药物发现中的对接以及打分:方法以及应用
在药物发现领域,CADD技术可以加速药物研发,而CADD又下分为SBDD,LBDD,FBDD,以及最近大热的AIDD。在SBDD领域,DOCKING始终是绕不开的话题,也是高通量虚拟筛选的利器,本文通过一篇综述,来尽可能的将DOCKING这一概念阐释清晰。
DrugScience
2021/03/04
7K0
一篇综述一个领域|在药物发现中的对接以及打分:方法以及应用
多尺度生成扩散模型预测蛋白-配体复合物结构的动态骨架
今天给大家介绍的是来自加州理工大学Zhuoran Qiao和NVIDIA团队发表在arxiv上的预印本《DYNAMIC-BACKBONE PROTEIN-LIGAND STRUCTURE PREDICTION WITH MULTISCALE GENERATIVE DIFFUSION MODELS》。作者提出了一种名为NeuralPLexer的扩散模型框架,这一框架能够利用蛋白的骨架模板以及分子图的输入,快速预测蛋白-配体复合物的结构以及它们的波动。另外,本文发现当NeuralPLexer应用于蛋白质折叠因为配体存在而显著改变的系统时,这一框架可以完善类结合态蛋白的结构。这一结果表明,数据驱动的方法可以捕获蛋白质和小分子实体之间的结构协作性,为新药物靶点的计算识别和功能小分子和配体结合蛋白的端到端可微设计展示了方向和前景。
DrugAI
2022/11/28
6350
多尺度生成扩散模型预测蛋白-配体复合物结构的动态骨架
Nat Commun|使用AlphaFold2改进对蛋白质-蛋白质相互作用的预测
2022年3月10日,斯德哥尔摩大学生物化学和生物物理系的Arne Elofsson和Patrick Bryant在Nat Commun杂志发表文章,介绍了AlphaFold2如何预测多种异质蛋白复合物的结构,尽管它被训练为预测单个蛋白链的结构。使用优化的MSA与AlphaFold2可以准确地预测异源二聚体复合物的结构。
智药邦
2022/06/08
4.9K0
Nat Commun|使用AlphaFold2改进对蛋白质-蛋白质相互作用的预测
CellPress | 为计算蛋白设计革命做好准备
由于对蛋白质功能的预测性控制和重新定义这些功能的能力已经推动蛋白质工程领域进入了一个前所未有的发展时代,因此,计算蛋白质设计被预测将为生物技术产业提供下一个量子飞跃。自然界只采样了约1012种不同的可能的蛋白质,而一个100个氨基酸的蛋白质有20100种潜在的序列变化。通过将计算设计融入到生产治疗性蛋白质的工作流程中,研发部门可以利用计算能力的快速发展,在创纪录的时间内设计出精确的功能性新型蛋白质治疗剂。
DrugAI
2021/02/02
9090
CellPress | 为计算蛋白设计革命做好准备
榕树集-Rosetta MotifGraft
蛋白质界面(protein interface)是指两个或更多蛋白质之间的接触面或结合区域。它们是蛋白质相互作用的关键部分,可以调节细胞功能的许多重要过程,如信号传导、代谢、免疫反应和细胞黏附。蛋白质界面的形状、化学特性和静电性质等因素对于蛋白质的相互作用方式和特异性都有着重要的影响。由于蛋白质界面在生物学和生物医学中的重要性,因此研究蛋白质界面的结构和功能已成为生物学、生物医学、生物信息学和药物设计领域的热门课题。
DrugScience
2023/05/24
4630
榕树集-Rosetta MotifGraft
蛋白设计中的深度学习方法
今天为大家介绍的是来自耶鲁大学Gregory W.Kyro团队的一篇论文。深度学习已经改变了蛋白质设计领域,实现了精确的结构预测、序列优化和从头开始的蛋白质生成。通过AlphaFold2、RoseTTAFold、ESMFold等在单链蛋白质结构预测方面的进展已经达到接近实验精度的水平,这启发了后续工作通过AlphaFold Multimer、RoseTTAFold All-Atom、AlphaFold 3、Chai-1、Boltz-1等扩展到生物分子复合物。生成模型如ProtGPT2、ProteinMPNN和RFdiffusion已经突破了基于自然进化的限制,实现了序列和主链设计。最近,包括ESM3在内的序列-结构联合共同设计模型,将这两种模式整合到统一框架中,从而提高了可设计性。尽管取得了这些进展,但在建模序列-结构-功能关系以及确保训练数据所涵盖的蛋白质空间区域之外的稳健泛化方面仍然存在挑战。未来的进展可能会集中在序列-结构-功能共同设计框架上,这些框架能够比独立处理这些模式的模型更有效地建模适应度景观。目前的能力,加上令人眩晕的进步速度,表明该领域即将实现快速、合理地设计具有定制结构和功能的蛋白质,超越自然进化所施加的限制。
DrugAI
2025/04/15
670
蛋白设计中的深度学习方法
推荐阅读
相关推荐
3.14的艺术:π的第100000000000000···
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档