首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

比对得到的SAM文件怎么看?

SAM ( Sequence Alignment Map ) 文件是reads比对到基因组后得到的结果文件,记录了reads mapping到基因组的各项信息。...BAM文件是SAM文件的二进制格式,保留SAM文件全部信息的同时极大压缩了SAM文件的体积,我们比对完成后获得的一般都是BAM文件。...@PG:比对时使用的工具指令。 @RG:样本信息。 @CO:其他注释信息。 比对结果主要包括11列信息: ? ? 1. QNAME:reads名称。 2. FLAG:reads比对情况。...RNAME:比对至参考序列的名称。 4. POS:比对到的位置。 5. MAPQ:比对质量。 6. CIGAR:比对情况信息。 7. RNEXT:与之配对的另一条reads所在的参考序列名称。"...除了这11列信息外,还有一些其他信息: NH:i:n 表示reads比对到参考序列位置的个数。 AS:i:n 表示比对得分。

3K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    给你几条蛋白序列,用R语言怎么比对

    就是全部比对上的,*就是存在gap的位点 当然,如果比对的序列很多,还可以增加logo # 示例代码 msaPrettyPrint(myFirstAlignment, output="asis", y=...接下来才是重点 上面函数使用很简单,关键是我们得到了比对的结果,怎么提取我想要的位点呢 其实之前biostar上也有人提出了这个问题:https://www.biostars.org/p/467870/...也就是说,他之前感兴趣的位点是82位的AA,想要看看比对后这个AA对应着哪个AA。...但是他发现,比对后原来的AA位置变成了95。所以不知道应该怎么去统计 ? 这里给出我自己的理解 首先明确,比对前后的差异在什么地方?...=》原来可以比对的当然能对应,但是不能比对的分了两种情况:一个是硬比对(比如D比对到了N);一个是软比对,即增加了gap(比如D 比对到. )。 麻烦就出在gap身上,原来序列没有,比对过程加上去。

    2.6K11

    MySQL数据类型选择性能比对

    ---+ | Leshami | http://blog.csdn.net/leshami | +---------+------------------------------+ 二、基于无索引情形比对...表上统计信息,mysql统计信息不是很准确,如下图,基于bigint数据类型占用的磁盘你空间与char类型占用磁盘空间等同。...image.png 二、基于索引情形比对 下面为过滤条件列mobile添加索引列,观察性能表现 CREATE INDEX uk_mobile ON tb_char(mobile); CREATE...uk_mobile ON tb_bigint(mobile); 如下图所示,索引占用磁盘开销是bigint数据类型最小,基于索引查询的时间,三者相当 image.png 三、基于索引列分组聚合情形比对...为了更好比对性能,下面基于索引列进行分组以及聚合运算,可以看出依旧是bigint数据类型性能最佳 image.png 四、最终比对结果及结论 最终完整结果图: image.png

    65120

    使用python实现MySQL表结构比对【初级版】

    使用Python写了个最基本的表结构比对告警脚本, 目前这个版本只能做到发现表结构存在差异的表。后续考虑再迭代下,看如何把差异的表和列的明细也报出来。...configs.py 内容如下: # MySQL数据源的信息 mysql_source_host = "localhost" mysql_source_port = "3306" mysql_source_user...dest_tb_set): # s1.add(i[0]) # 如果要全部都报出来,用下面这种写法 s1.add(i[0]) print('表结构(只比对了列和索引...,未包括字符集和排序集)检查完成,存在差异的表如下 ---> ', s1) else: print('表结构(只比对了列和索引,未包括字符集和排序集)检查完成,没有发现存在差异的表') stop_time...= time.time() time_dur = stop_time - start_time print(f"耗时 {time_dur} 秒") readme 内容如下: 上面程序里面,我们没有比对表中的字符集和排序集

    93820

    MySQL数据类型选择性能比对详解

    ---+ | Leshami | http://blog.csdn.net/leshami | +---------+------------------------------+ 二、基于无索引情形比对...表上统计信息,MySQL统计信息不是很准确,如下图,基于bigint数据类型占用的磁盘你空间与char类型占用磁盘空间等同。...-- 下面执行以下三条SQL语句比对性能 SELECT * FROM tb_char WHERE mobile = '17998335908'; SELECT * FROM tb_varchar WHERE...二、基于索引情形比对 下面为过滤条件列mobile添加索引列,观察性能表现 CREATE INDEX uk_mobile ON tb_char(mobile); CREATE INDEX uk_mobile...为了更好比对性能,下面基于索引列进行分组以及聚合运算,可以看出依旧是bigint数据类型性能最佳 四、最终比对结果及结论 最终完整结果图: 结论: 1)满足需求的前提使用更小长度的数据类型(更少磁盘占用

    54810

    序列比对(22)中间字符串分支定界方法中更紧的界

    前文介绍了中间字符串的算法和代码,但是使用分支定界策略时所使用的界限是很宽松的。本文给出了一个更紧的界限。...对分支定界法的简单回顾 前文《序列比对(21)中间字符串问题的算法及实现代码》介绍了中间字符串的算法和代码,但是使用分支定界策略时所使用的界限是很宽松的。分支定界法的伪代码如下: ?...TotalDistance(v, DNA)的下界 */ void findMedianStr(Seq* mulSeq, const int t, const int l); /* 寻找中间字符串...printf("time spent: %s\n", tstr); free(tstr); return 0; } char* sec2time(time_t t) { /* 将秒数转化为时间字符串...} } return minDist; } void findMedianStr(Seq* mulSeq, const int t, const int l) { /* 寻找中间字符串

    1K30

    序列比对(21)中间字符串问题的算法及实现代码

    前文介绍了基序发现问题和中间字符串问题。本文给出了中间字符串的算法和实现代码。 中间字符串问题的简单算法及伪代码 《序列比对(20)基序发现问题的算法及实现代码》给出了基序问题的算法和实现代码。...本文将介绍中间字符串问题的算法,并给出实现代码。 ? 由于要遍历所有可能的起始位点,如前文《序列比对(20)基序发现问题的算法及实现代码》一样,我们采用树结构以及DFS(深度优先搜索)。...为identity.txt文件中的7条序列计算中间字符串 ? 为mutated.txt文件中的7条序列计算中间字符串 分支定界法的结果如下: ?...为identity.txt文件中的7条序列计算中间字符串 ? 为mutated.txt文件中的7条序列计算中间字符串 具体代码 上文及前文都假定多条序列的长度是一样的,但是实际情况并不总是如此。...代码实现过程中考虑到这一点,做了改进,使得多条序列长度不一致的情况下也可以用此代码来计算中间字符串

    91620

    MySQL实战第十一讲-怎么字符串字段加索引?

    同时,MySQL 是支持前缀索引的,也就是说,你可以定义字符串的一部分作为索引。默认地,如果你创建索引的语句不指定前缀长度,那么索引就会包含整个字符串。...接下来,我们再看看下面这个语句,在这两个索引定义下分别是怎么执行的。...但是,遇到前缀的区分度不够好的情况时,我们要怎么办呢? 比如,我们国家的身份证号,一共 18 位,其中前 6 位是地址码,所以同一个县的人的身份证号前 6 位一般会是相同的。...就只考虑登录验证这个行为的话,你会怎么设计这个登录名的索引呢? 问题解答:由于这个学号的规则,无论是正向还是反向的前缀索引,重复度都比较高。...其实这个就是一种 hash,只是它用了最简单的转换规则:字符串转数字的规则,而刚好我们设定的这个背景,可以保证这个转换后结果的唯一性。

    2.3K30

    使用python实现MySQL和其他数据源的数据比对

    日常工作有时候需要比对不同MySQL或者其他数据源的差异情况,如果是主从环境可是用percona-toolkit工具包,如果是非主从环境的数据比对,就需要我们自行写脚本实现。...data_diff用于比对mysqlmysql/pg/es之间的数据差异,mysql2mysqlmysql2pg需要确保二者的列的顺序是一致的,mysql2es二者的列顺序无所谓。...说明mysql2mysql 用于源端和目标端都是MySQL的数据比对场景。mysql2pg 用于源端是MySQL,目标端是PG的数据比对场景。...mysql2es 用于源端是MySQL,目标端是ES的数据比对场景。它会将差异的es id输出到redis queue中。...redis==3.5.3性能step为1000时,每秒大约可以比对2.5k条记录不足mysql2pg的脚本,不能处理bit类型,会出现误判的情况mysql2pg的脚本,暂时不具备where条件的功能,

    23310

    mysql字符串转数字_mysql字符串转数字小计

    问题:要求比较’100%’和’95%’的大小 实践:mysql> SELECT ‘100%’ > ‘95%’; +—————-+ | ‘100%’ > ‘95%’ | +—————-+ | 0 | +—...————-+ 1 row in set (0.00 sec) 发现’100%’竟然小于’95%’ 原因:因为是字符串字符串比较是递归字符串里面的每个字符进行比较,先去第一个,1和9比较大小,则1比9小...,输出结果;如果相等,则继续进行下一个字符比较 如果想要对这种类型的字符串进行大小比较,该怎么做呢?...DATETIME 浮点数 : DECIMAL 整数 : SIGNED 无符号整数 : UNSIGNED 因为要转换为数字类型,如果是’100.12%’这种格式,最好是用decimal 新的比较方法如下:mysql...DECIMAL(10,2)) >CAST(‘99.6%’ AS DECIMAL(10,2)) bj; +—-+ | bj | +—-+ | 1 | +—-+ 1 row in set (0.00 sec) mysql

    2.4K20

    mysql语句截取字符串_mysql分割字符串split

    MySQL 字符串截取相关函数: 1、从左开始截取字符串 left(str, length) 说明:left(被截取字段,截取长度) 例: select left(content,200) as abstract...from my_content_t 2、从右开始截取字符串 right(str, length) 说明:right(被截取字段,截取长度) 例: select right(content,200) as...str返回一个子字符串,起始于位置 pos。...带有len参数的格式从字符串str返回一个长度同len字符相同的子字符串,起始于位置 pos。 使用 FROM的格式为标准 SQL 语法。也可能对pos使用一个负值。...假若这样,则子字符串的位置起始于字符串结尾的pos 字符,而不是字符串的开头位置。在以下格式的函数中可以对pos 使用一个负值。 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

    4.8K30

    mysql字符串函数

    ,则结果为NULL 3.替换字符串的函数insert(s1,x,len,s2) 返回字符串s1,其子字符串起始于x位置和被字符串s2取代的len字符,如果x超过字符串长度,那么返回值为原始字符串,如果len...(s1 from s) 删除字符串s中两端所有的子字符串s1 7.重复生成字符串的函数repeat(s,n) 返回一个由重复的字符串s组成的字符串,字符串s的数目等于n,若n小于等于0,则返回一个空字符串...select repeat('mysql',3) = mysqlmysqlmysql 8.空格函数space(x) 和替换函数replace(s,s1,s2) space(x) 返回一个由n个空格组成的字符串...replace(s,s1,s2)使用字符串s2替代字符串s中所有的字符串s1 9.比较字符串大小的函数strcmp(s1,s2) 若所有的字符串均相同,则返回0, 10.获取子串的函数substring...12.字符串逆序的函数reverse(s) 将字符串s反转,返回的字符串的顺序和s字符串顺序相反 13.返回指定位置的字符串的函数 在elt(n,s1,s2,s3,..)若N=1,则返回值为字符1,若

    2.5K30
    领券