一、HiC-Pro 简介
HiC-Pro,可能是最好用的HiC数据标准化处理工具,源于“HiC data processing”。流程主要分为6个步骤,比对、过滤HiC比对结果、检测有效HiC序列、结果合并、构建HiC关联图谱以及关联图谱标准化。
HiC-Pro可以输出各个尺度的HiC标准化互作图谱,从每个窗口5Kb到1Mb,当然窗口越大,所生成的互作关系越少,计算时间就越少,反之则越多。此外HiC-Pro还可以进行HICUP、HiCdat等众多HiC数据处理软件所不能进行的等位基因特异性HiC分析。
二、下载安装
(1)下载地址:
https://github.com/nservant/HiC-Pro (版本2.7.8)
(2)安装:
依赖软件还是比较多,分别如下。
bowtie2、g++、sort、samtools(>1.1)
Python2 (注释是2,3不支持version >=2.7)、4个Python模块(pysam (>=0.8.3), bx-python(>=0.5.0), numpy(>=1.8.2), scipy(>=0.15.1) )
R、以及两个R包(RColorBrewer和ggplot2 (>2.2.1) )
(3)解压安装:
unzip HiC-Pro-master.zip && make configure && make install (安装成功如下所示)
(代码可左右滑动,下同)
三、使用
四、结果查看
-o 输出文件夹中,共有bowtie_results和hic_results两个结果文件夹。
其中bowtie_results文件夹下共有三个文件夹:bwt2、bwt2_global和bwt2_local,分别是序列比对结果、染色体间关联比对结果和染色体内部关联比对结果。其中bwt2文件夹下有一些数据统计结果的输出文件,如mpairstat文件(如下)。
hic_results文件夹下共有data、matrix以及pic三个文件夹。data文件夹下是比对上的有效序列对,文件末尾为_allValidPairs;pic文件夹下是各类结果数据统计;matrix文件夹下分为 iced 和 raw 两个文件夹,分别标准化后的关联矩阵和初始的关联矩阵。
领取专属 10元无门槛券
私享最新 技术干货