首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat. Cell. Bio. | 生物大数据分析揭示全新的基因调控模式和潜在的抗癌药物靶点

在生物体内,绝大部分基因需要先转录成信使核糖核酸(mRNA),进而再翻译成蛋白质来行使功能。真核生物中的mRNA不但有能够编码蛋白的部分,也包含两段非翻译的区域(UTR)。它们分别位于5’端从mRNA头部到翻译起始密码子,以及3’端从终止密码子到mRNA 的尾部。在高等生物中,整个转录和翻译过程都存在非常复杂的调控模式,其中最重要的一种调控模式之一就是mRNA的剪接(splicing)。它会将刚转录出来的mRNA前体切割成两种不同类型的小片段,包括外显子和内含子,然后再将不同的外显子片段拼接起来(https://baike.baidu.com/item/RNA剪接/1618134)。在人的基因组中,超过95%的基因都有着不同的剪接模式,而异常的剪接会影响各种疾病的产生和发展,这其中就包括癌症。

02

学界 | 普适注意力:用于机器翻译的2D卷积神经网络,显著优于编码器-解码器架构

深度神经网络对自然语言处理技术造成了深远的影响,尤其是机器翻译(Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Jean et al., 2015; LeCun et al., 2015)。可以将机器翻译视为序列到序列的预测问题,在这类问题中,源序列和目标序列的长度不同且可变。目前的最佳方法基于编码器-解码器架构(Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Bahdanau et al., 2015)。编码器「读取」长度可变的源序列,并将其映射到向量表征中去。解码器以该向量为输入,将其「写入」目标序列,并在每一步用生成的最新的单词更新其状态。基本的编码器-解码器模型一般都配有注意力模型(Bahdanau et al., 2015),这样就可以在解码过程中重复访问源序列。在给定解码器当前状态的情况下,可以计算出源序列中的元素的概率分布,然后使用计算得到的概率分布将这些元素的特征选择或聚合在解码器使用的单个「上下文」向量中。与依赖源序列的全局表征不同,注意力机制(attention mechanism)允许解码器「回顾」源序列,并专注于突出位置。除了归纳偏置外,注意力机制还绕过了现在大部分架构都有的梯度消失问题。

02

分析了10个垂直行业后,告诉你大数据应用面临哪些挑战

本文转自网络,如涉侵权请及时联系我们 大数据已经成为过去几年中大部分行业的游戏规则,行业领袖,学者和其他知名的利益相关者都同意这一点, 随着大数据继续渗透到我们的日常生活中,围绕大数据的炒作正在转向实际使用中的真正价值。 虽然了解大数据的价值仍然是一个挑战,但其他实践中的挑战包括资金投入和投资回报率以及相关技能仍然是大数据行业排名前列。Gartner调查显示,75%以上的公司正在投资或计划在未来两年投资大数据。 一般来说,大多数公司都希望有几个大数据项目,公司的主要目标是增强客户体验,但其他目标包括降低

07
领券