首页
学习
活动
专区
工具
TVP
发布

小明的数据分析笔记本

专栏成员
621
文章
1064226
阅读量
112
订阅数
分享 | ATAC-Seq 分析流程
ATAC-Seq 是“Assay for Transposase-Accessible Chromatin with high-throughput Sequencing”的缩写。 ATAC-Seq 方法依赖于使用高活性转座酶 Tn5 的下一代测序(NGS)文库的构建。将 NGS 接头连接到转座酶上,该转座酶可以使染色质断裂并同时将这些接头整合到开放的染色质区域中。构建的文库可通过 NGS 测序,并使用生物信息学分析具有可及或可访问染色质的基因组区域。
用户7010445
2024-06-18
1500
R语言做生态位分化分析(2)找找参考论文
做这个分析用到的R包是 ENMtools,用到的函数是 identity.test()
用户7010445
2024-06-18
830
R语言把otu表格的绝对丰度转换为相对丰度
基本的思路是:先把otu表格宽格式转换成长格式,然后根据样本分组求和,生成一个新的列,然后用绝对丰度值除以求和列得到相对丰度,最后再转换为长格式
用户7010445
2024-06-18
1060
用R语言的circlize包复现一下Microbiome期刊中的圈图
没有找到论文中提供的数据,我们自己来构造数据,如何利用otu表格把数据整理成作图需要用的格式,这个今天的推文不做介绍,今天的推文只介绍已经有了作图需要用到的数据后如何作图。
用户7010445
2024-06-18
890
用R语言的ggplot2包复现一下Nature正刊论文中的气泡图
https://www.nature.com/articles/s41586-023-06877-w
用户7010445
2024-06-18
1030
R语言ggplot2复现一下CELL论文中的基因共线性图
https://www.sciencedirect.com/science/article/pii/S0092867424004732
用户7010445
2024-06-18
1130
minimap2+svim-asm+SURVIVOR流程基于基因组组装做结构变异检测
代码主要参考 GraffiTE 的代码,链接https://github.com/cgroza/GraffiTE/blob/main/main.nf这个工具是利用二代测序数据给TE做基因型分型然后研究TE多态性的。前面的步骤是基于组装好的基因组进行比对检测结构变异。我们把这部分代码拆出来学习一下。
用户7010445
2024-06-07
1080
R语言里将vcf文件转换为GenAlEx格式数据
https://grunwaldlab.github.io/Population_Genetics_in_R/Data_Preparation.html
用户7010445
2024-06-07
1110
R语言里做生态位分化分析(1)背景知识查询
发现ggtree的作者Y叔也关注了这个R包的作者的github。那这个作者也是个大佬无疑了。
用户7010445
2024-06-07
1110
学习Nature正刊论文中eQTL分析前对基因表达量的预处理
https://www.nature.com/articles/s41586-022-04808-9
用户7010445
2024-06-07
790
评估 beagle 基因型填充的准确率
最简单的一个思路,只保留vcf文件中不包含任何缺失数据的位点。然后随机把某些样本的部分位点替换成缺失,用beagle做基因型填充,比较填充后和填充前的一致性。
用户7010445
2024-05-29
1020
如何随机选择vcf文件中的变异位点
现在做群体基因组的论文大部分会公开自己论文分析中的变异检测结果,通常是vcf文件,我们自己可以把vcf文件下载下来试着复现论文中的内容,有时候vcf文件过大,每一步处理起来都会花费比较长的时间。有时候就想把这个vcf文件缩小,随机选择一部分。
用户7010445
2024-05-28
1140
跟着Nature学数据分析:plink计算SNP和SV之间的连锁不平衡R方值
https://www.nature.com/articles/s41586-022-04808-9
用户7010445
2024-05-27
1710
R语言利用vcf文件计算等位基因频率和连锁不平衡(LD)R方
https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-022-08418-7
用户7010445
2024-05-27
970
使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1909-7
用户7010445
2024-05-27
1130
跟着Nature学数据分析:minimap2+DeepVariant流程利用hifi数据检测snp和indel
https://github.com/YaoZhou89/TGG/tree/main/4.Graph_pangenome/1.construction_graph_genome
用户7010445
2024-05-18
1770
R语言rMVP包做GWAS(全基因组关联分析)分析实例
本篇推文的示例数据来源于参考书 《Genome-Wide Association Studies》的第十章 A Practical Guide to Using Structural Variants for Genome-Wide Association Studies。
用户7010445
2024-05-18
3921
生物信息学入门- Xshell 和 Xftp 的安装 远程链接云服务器
https://www.aliyun.com/daily-act/ecs/activity_selection?source=5176.11533457&userCode=3enjgk6n
用户7010445
2024-05-18
780
生物信息学入门~在购买的云服务器上安装anaconda3用于常用的软件安装
https://www.aliyun.com/daily-act/ecs/activity_selection?source=5176.11533457&userCode=3enjgk6n
用户7010445
2024-05-18
1110
R语言做基因表达量和变异位点的关联分析eQTL
http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
用户7010445
2024-05-09
1030
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档