前言
长链非编码 RNA(long non-coding RNA,lncRNA)是一类转录本长度超过 200 nt 、不编码蛋白的 RNA 。 lncRNA 能在表观遗传、转录及转录后水平上调控基因表达。 lncRNA 芯片可以快速、高效地筛选出与疾病或特定表型相关的差异 lncRNA ,为人类疾病的发生、发展和防治提供理论依据。
欧易生物从探针设计、数据挖掘等各个层面多方位地对 lncRNA 芯片进行了升级,更加贴近生物学意义的分析内容能够更好地满足您的研究与发文需求。
升级亮点
采用最新的高质量数据库
以往由于各个数据库中 lncRNA 条目繁多,用于验证的 lncRNA 很难找到对应资料及相关信息。欧易生物本次 lncRNA 芯片升级对各种数据库资源进行梳理,挑选高质量数据库进行探针设计,主要以人、大小鼠 RefSeq 数据库中的转录本进行探针设计。
基于对各个数据库资源的整理,新版 lncRNA 芯片只保留高质量的数据来源,去除了低质量或低可信度的数据,故部分芯片覆盖 RNA 数目有所调整。
创新的自主探针设计技术
探针设计采用欧易自行研发的探针设计技术,具有绝佳的去冗余能力和极高的特异性。结合 k-mer 方法选择探针,能够实现整张芯片上所有探针的解链温度控制在 1° 的标准偏差范围内,同时能够最大程度的减少探针自我杂交、交叉杂交现象造成的不良影响。
碱基百分比分布图| 利用新方法设计的探针,其GC含量与相应物种整体的基因组GC含量相近(人:40.9% ,大鼠:42.34% ,小鼠:42.49%)。
Agilent Earray 检测结果图| 采用新方法设计的探针利用 Agilent Earray 检测显示大多数均为高质量的探针(BC1是最好的)。
新版数据库信息
Human:源于 GRCh38.p12 版本的 mRNA 及 lncRNA 序列设计探针(最新版本2018.3.30), circRNA 来源于 circbase 最新数据库;
Mouse:源于 GRCm38.p6 版本的 mRNA 及 lncRNA 序列设计探针(最新版本2017.10.3), circRNA 来源于 circbase最新数据库;
Rat:源于 Rnor_6.0 版本的 mRNA 及 lncRNA 序列设计探针(最新版本2017.12.21)
各款芯片信息汇总
升级后的 lncRNA 芯片分析内容示例
差异lncRNA与差异gene共表达分析
使用皮尔森相关性检验(pearson)根据差异lncRNA与差异gene表达量数据,计算两者表达相关性,发掘差异 lncRNA 与差异 gene 的共表达关系。
差异表达 gene 和 lncRNA 的 circos 图示例| 图片说明:最外圈为该物种的常染色体分布示意图;第二圈和第三圈为差异表达 gene 在染色体上分布,红色线条表示上调,绿色线条表示下调,柱子越高,表示该区间差异基因数目越多;第四圈和第五圈为差异表达 lncRNA 在染色体上的分布,表现形式同 gene ;内部连线表示 Top 500 共表达 lncRNA 和 gene 的对应关系。
lncRNA 功能预测
基于差异共表达结果,对每一个lncRNA共表达的差异gene进行GO和KEGG富集分析。lncRNA的功能可能同这些GO或KEGG富集分析关系紧密。
GO富集Top10条目示例| 图片说明:图中 X 坐标为 -log10Pvalue ,Y 坐标为 GO 条目名称。
KEGG富集Top10气泡图示例| 图片说明:图中 X 轴 Enrichment_Score 为富集分值,气泡越大的条目包含的差异基因数目越多,气泡颜色由灰-红变化,其富集 pvalue 值逐渐变小,表示显著程度逐渐增大。
lncRNA cis 作用靶基因分析
基于差异共表达结果,搜索差异表达lncRNA其上下游100k范围内的所有编码基因,并与该lncRNA有显著共表达(皮尔森相关性计算)的差异基因取交集。这些在基因组上临近且表达模式上存在共表达的基因很可能被该lncRNA所调控。
lncRNA 与 gene 的 cis 调控 Top 20 图示例| 图片说明:图中 * 代表 p 值显著性的等级, *** 为最显著 p(0,0.001)、** 为次优显著 p(0.001,0.01),* 为显著 p(0.01,0 .05);y 轴左右分别为 mRNA 与 lncRNA ;x 轴为 mRNA 与l ncRNA 的距离,负值表示上游,正值表示下游;相同 lncRNA 表示为同一颜色条形图。
lncRNA trans 作用靶基因分析
基于差异共表达结果,预测候选共表达lncRNA和gene在核酸水平上的结合情况,按照两条核酸分子直接互作的碱基数不少于10个,且碱基结合自由能不大于-100为筛选条件,筛选出的互作lncRNA和gene可能存在直接调控。
lncRNA trans 靶标互作网络图示例| 图片说明:红色结果表示 lncRNA ,绿色节点表示 gene ,节点大小代表数量多少。
lncRNA 转录因子关联分析 (新增)
基于差异共表达结果,对于每一个差异表达的lncRNAs,计算得到与之共表达的编码基因,并计算每个TF条目中差异gene富集的显著性。
转录因子关联富集 Top 20 气泡图示例| 图片说明:x 轴 Enrichment Score 为富集分值,气泡越大的条目包含的差异蛋白编码基因数目越多,气泡颜色按紫-蓝-绿-红变化,其富集 pvalue 值越小,显著程度越大。
欧易特色
信息全面
覆盖多个数据库的 lncRNA 信息、涵盖全面的 lncRNA 序列
物种丰富
包含人、大鼠、小鼠 lncRNA 芯片,其他物种可以进行芯片定制
可同时检测 lncRNA 和 mRNA
可在一张芯片上同时对 lncRNA 和 mRNA 进行检测,挖掘二者之间的关联
产品质量有保证
欧易生物是 AffymetrixⓇ 和 AgilentⓇ 的双认证企业
心动不如行动,详细信息欢迎联系我们或向当地销售垂询。
END
NTLx撰文
本文系欧易生物原创
领取专属 10元无门槛券
私享最新 技术干货