本文来自 stack overflow 上的一个帖子 base与data.table适用 SQL版 流行的dplyr 最后看看各种操作的性能吧 data.table 就是牛批!
方案 在一个新的 R 会话中使用 search() 可以查看默认加载的包。...#> [19] "package:datasets" "package:methods" #> [21] "Autoloads" "package:base" 以下提供的函数能够列出包中的函数和对象...showPackageContents <- function(packageName) { # 获取特定包所有内容的列表 funlist 的东西 idx <- grep("<-", funlist) if (length(idx) !...qr.resid qr.solve qr.X quarters quarters.Date quarters.POSIXt quit R_system_version R.home R.Version
如何将列表中的元素(字符串类型的值)连接在一起(首位相接) a = ['a', 'b', 'c', 'd', 'e'] s = '+' print(s.join(a)) a+b+c+d+e 2....字符串的join 方法的作用是什么,使用join 应该注意什么,请举例说明 join 方法可以将列表中的字符串类型元素连接起来。...并且可以指定元素值直接的分隔符 dirs = '', 'use', 'local', 'xxx', '' print(dirs) path = '/'.join(dirs) print(path) path
---背景:通过 obproxy 连接 OB 后,发现: kill 命令使⽤ show processlist 中的 ID 能执⾏成功, 使⽤ information_schema.processlist...于是就进⾏了各种连接测试,解惑两个问题:kill中session_id的来源;是否可以⼀次性⼲掉⼀个租户的所有连接;测试说明:说明:session_id 是 kill 语句的参数,session_id和下...__all_virtual_processlist 中的ID⼀致;show processlist 中的记录和上⾯2表的ID不⼀致,执⾏kill语句的时候,采⽤的是show processlist中的ID...__all_virtual_processlist 中记录的是所有到OB的连接信息;客户可能直连observer,也可能是通过obproxy连接OB,所有连接信息都会记录到表中;3.show processlist...在执⾏kill命令时,可以通过任意⽅式连接OB,并通过show processlist获取连接ID; 也可以通过直连后侧的observer,通过oceanbase.
一、前言 前几天在帮助粉丝解决问题的时候,遇到一个简单的小需求,这里拿出来跟大家一起分享,后面再次遇到的时候,可以从这里得到灵感。...二、需求澄清 问题如下所示: 三、实现过程 这里【听风】一开始给了一个集合求差集的方法,差强人意。 不过并没有太满足要求,毕竟客户的需求是分别需要两个列表中不重复的元素。...后来【听风】又给了一个方法,如下所示: 这次是完全贴合要求了,代码运行之后,可以得到预期的效果: 这里再补充一个小知识点,提问如下图所示: 后来【听风】给了一个方法,如下图所示: 原来列表转df...是这样玩的,接下来你就可以把数据导出为Excel等其他格式了,不再赘述。...这篇文章主要盘点一个Python实用的案例,这个案例可以适用于实际工作中文件名去重等工作,感谢【听风】大佬给予耐心指导。
user_id,new_tag_id from user_tag lateral view outer explode(split(tag_id,',')) t as new_tag_id) tt left...join tag on tt.new_tag_id = tag.tag_id group by tt.user_id 查询结果 查询逻辑 step1 列转行,将user_tag表中的tag_id 转换为多行...,每行一个tag_id内容,该处需要注意第三行,tag_id为空,lateral view 属于内联接,所以需要使用lateral view outer,属于考察细心程度的点 select user_id...bigint, tag_id string ) 创建表tag create table tag ( tag_id bigint, tag_desc string ) 向user_tag中插入数据...insert into user_tag values (111,'1,2,3'), (222,'1,3,4'), (333,null), (444,'2'); 向tag表中插入数据 insert into
大家好,又见面了,我是你们的朋友全栈君。...1.冒号的用法 1.1 一个冒号 a[i:j] 这里的i指起始位置,默认为0;j是终止位置,默认为len(a),在取出数组中的值时就会从数组下标i(包括)一直取到下标j(不包括j) 在一个冒号的情况下若出现负数则代表倒数某个位置...a[i:-j] 这里就是从下标i取到倒数第j个下标之前(不包括倒数第j个下标位置的元素) 1.2 两个冒号 a[i:j:h] 这里的i,j还是起始位置和终止位置,h是步长,默认为1 若i/j位置上出现负数依然倒数第...i/j个下标的位置,h若为负数则是逆序输出,这时要求起始位置下标大于终止位置 在两个冒号的情况下若h为正数,则i默认为0,j默认为len(a); 若h为负数,则i默认为-1(即最后一个位置),j默认为-...python’ c=a[1:-2] print(c) >>yth #-2代表倒数第二个位置,即从下标1取到倒数第二个位置之前 a=’python’ b=a[::-1] print(b) >>nohtyp #前两个冒号和上面一致
,这个pbcmc居然去责怪了 genefu 包,两个R包的地址: https://bioconductor.riken.jp/packages/3.3/bioc/html/pbcmc.html https...://bioconductor.org/packages/release/bioc/html/genefu.html 我去查看了叫做pbcmc的R包的源代码,发现里面大量使用两个冒号的语法: grep...::pam50$centroids.map$EntrezGene.ID R/PAM50Permutate.R: pam50.aux<-genefu::pam50 R/PAM50Report.R:...那么问题来了,为什么两个冒号这样的语法失效了呢 其实报错给的信息很清晰,因为 'pam50' is not an exported object from 'namespace:genefu',也就是说...本来呢,我其实是应该去修改 genefu 这个包,让它 export里面的pam50这个数据,而不是修改 pbcmc的R包的源代码。不过,无所谓啊, 让他们两个包互相适应就好了。
通常我们会使用比对好的fasta文件构建进化树,fasta文件中大于号后的内容就是最终进化树上的文字标签。如果拿到进化树文件后你想替换掉其中的一些内容,那该怎么办呢?...本篇推文介绍一下使用R语言的ggtree包实现这个目的 这个问题是来源于公众号的一位读者的提问 ?...大家可以关注我的公众号 小明的数据分析笔记本 留言相关问题,如果我恰巧会的话,我会抽出时间介绍对应的解决办法 首先你已经有了构建好的进化树文件 (Synergus:0.1976902387,(((((Periclistus...image.png 第一列x就是进化树中原本的序列名称 第二列y是想要替换成的id名称 读入进化树文件 library(treeio) tree<-read.newick("ggtree_practice_aligned.fasta.treefile...image.png 把这个新的进化树写出到文件里 write.tree(tree1@phylo,file = "pra.nwk") 这样就达成目的了 这里导出的进化树文件没有了最初的支持率的信息,我们再通过一行代码给他加上就好了
题意 给出两个字符串, 你需要修改第一个字符串,将所有与第二个字符串中相同的字符删除, 并且第二个字符串中不同的字符与第一个字符串的不同字符连接 样例 给出 s1 = aacdb, s2 = gafd...以 s1 = aacdb, s2 = gafd 为例 先将 s2 的每一个字符都放进 Map 集合中,将字符当作键,将值赋为 1,此时 Map 集合中应为: {"g':1, "a":1, "f":1,...然后将 s1 的每一个字符依次判断是否存在与 Map 集合的 Key 中,如果相等则将 集合中该 Key 的值变为 2,如果不相等,则将结果加入到字符串缓冲区中。...最后将 s2 再遍历一次,将在 Map 集合中 Value 为 1 的 Key 依次添加到字符串缓冲区中即可。...sb.append(c); } } return sb.toString(); } } 原题地址 Lintcode:连接两个字符串中的不同字符
如下所示数据组成,我想按姓名分组组成结果形式:oyy 23#24#25#26. mysql> select * from student; +----+------------------+------+ | id...oyy | 25 | | 8 | oyy | 26 | +----+------------------+------+ 可以使用mysql的函数
一个需求,实现去除列表中的多个重复对象。 比如 a,b,c 在列表1 出现,bc 在列表2 出现,ad 在列表3 出现,那么仅仅保留1:abc, 2:空, 3:d。...这个列表中的对象可以是数据框,也可以是单个字符,也可以是列表,可以是任何类型的对象。...一个举例场景就是: 我有一个列表对象,这个列表对象里还有若干个列表,每个列表里面还有若干个对象,每个对象是一个存放基因名的向量。 这些不同的列表是不同的实验,而每个对象对应的是一个样本的富集基因。...思路就是循环列表中的每一个子集中的所有内容,去和之前的所有内容进行比较(%in%);并且子集本身也是去重的。...a2 %in% a1] tmp13[[i]] = a3 } tmp13 就是根据比较去重后的新列表了。 因为这个代码长度的缘故,请实际动手操作一下,体验一下过程。
连接两个字符串中的不同字符。 给出两个字符串, 你需要修改第一个字符串,将所有与第二个字符串中相同的字符删除, 并且第二个字符串中不同的字符与第一个字符串的不同字符连接。...样例 给出 s1 = aacdb, s2 = gafd 返回 cbgf 给出 s1 = abcs, s2 = cxzca; 返回 bsxz c++11中规定字符串可以直接相加,字符串对象可以加字符串常量...string::find()函数很好用,这里恰好可以做一个总结: 共有下面四种函数原型: 四种函数原型返回值都是size_t,即字符串的一个索引,如果找到返回索引,如果找不到返回-1,即string...//可以直接查找字符串对象, size_t find (const string& str, size_t pos = 0) const noexcept; c-string (2) //从类型的字符串...,定义一个新的string对象res,然后先遍历s1,在s2中寻找s1的每个字符,找不到的话就把这个字符加到res上,然后对s2做同样的操作,就能找到s2中和s1不同的字符了,这样最后加起来就只最终的res
RepVGG[2]进一步改进这一方法,训练阶段显式地使用残差连接,推理阶段使用“重参数化”方法,将残差连接合并到残差中,从而得到直筒型的模型。并首次在ImageNet数据集上,获得了超过80%准确率。...中的一个残差块,其中一个ReLU位于残差连接内部,另一个位于外部;而下图b)所示为RepVGG的连续两个残差块,ReLU均位于残差连接外部。...因此一种能够等价去除ResNet中残差连接的方法,就显得很有价值。 02/RM 操作 RM Operation的发音和功能与remove相同:等价去除(remove)模型中的残差连接。...有时不得不裁剪掉一些有用的通道。3)使用索引的方式,允许输入输出通道数量不等,如[16,17]。两个维度不同的矩阵,可以通过索引加到一起,因此剪枝可以不受残差连接的限制。...可以看出由于在训练过程中引入了跟ResNet一样,跨越非线性层的残差连接,RM操作能够使RepVGG在深层时表现更好。
想多造一些测试数据,表中字段又多一个个敲很麻烦,导出表中部分字段数据又不想导出ID字段(因为ID字段是自增的,导出后再插入会报唯一性错误),select * 查出来又是所有的字段。...可以通过如下SQL查询表中所有字段通过逗号连接,然后复制出来进行select查询再导出 select group_concat(COLUMN_NAME) '所有字段' from information_schema.COLUMNS...where table_name = '表名'; 执行效果如下: 下面的语句可以查询某个库中某个表的所有字段,字段的名称、类型、字符长度和字段注释等信息 select * from information_schema.COLUMNS
下面是记录单细胞学习过程中的两个R包报错 (生信技能树学员周现在) 1.SeuratData包,因为学习单细胞测序的很多示例数据全在这个包里,所以这个包的出镜频率其实是比较高的,但是我在成功下载后library...在帅气的Nickier助教的提示下,我卸载了R和Rtools,重启电脑后,重装了R和Rtools,之后就可以成功安装harmony包了。...但是因为在R语言学习的过程中,我一般都不会管Warning的信息只要不Error就接着跑。...3.总结和反思 我们在学习的过程中难免会遇到很多问题,但是小洁老师在课上曾经展示的一张遇见报错怎么办的图让我印象深刻,也让我意识到要早日跳脱学生思维,要学会自己解决问题,其实我遇到的大部分问题都有前人遇见并解决过了...,可以先自己搜索并试着解决(就比如其实我遇见的这个Warning in system(cmd) : 'make' not found,输入到检索引擎,其实是有解决方案的,但是因为我在学习的过程中形成了一个思维定式就是只管
参考链接: 如何在Java 8中从Stream获取ArrayList 几种列表去重的方法 在这里我来分享几种列表去重的方法,算是一次整理吧,如有纰漏,请不吝赐教。 1....Stream 的distinct()方法 distinct()是Java 8 中 Stream 提供的方法,返回的是由该流中不同元素组成的流。...换句话讲,我们可以通过重写定制的 hashCode() 和 equals() 方法来达到某些特殊需求的去重。 ... 注:代码中我们使用了 Lombok 插件的 @Data注解,可自动覆写 equals() 以及 hashCode() 方法。 ...总结 以上便是我要分享的几种关于列表去重的方法,当然这里没有进行更为详尽的性能分析,希望以后会深入底层再重新分析一下。如有纰漏,还望不吝赐教。
首先:JOIN 通常与 ON 关键字搭配使用 其次我们来看我们的两个表格: table1: ? table2: ?...在这里,INNER JOIN(内连接,或等值连接):取得两个表中存在连接匹配关系的记录。...,它不管on中的条件是否为真,都会返回左边表中的记录。...在这里我们使用on 条件是 table1中的age1和table2中的age2相同,那么我们运行结果如下: ?...是否输出的结果把两表给结合起来了,你们发现,age1不同的数据并没有输出出来,其实这样的结果比较像数学中的交集呢?这个就是 INNER jion
表的连接在sql语句中尤为重要。外连接,内连接,半连接,反连接等等各种连接,看似简单的一个连接里面还是有不少的细节的。对于sql调优来说也是很重要的。...像下面的形式的sql就属于半连接,使用了in子句,对于exists的实现也是属于半连接。...比如下面的形式,可能输出的结果就多了很多。大概14条记录,但是通过半连接的方式会输出3行记录。...,可能在实际的使用中,最直观的感受还是通过执行计划来看到。...启用了半连接,在执行计划中会有semi的字样。 ? 也可以手动指定不需要走半连接。使用Hint no_semijoin ?
关于Oracle的半连接,反连接,我一直认为这是一个能讲很长时间的话题,所以在我的新书《Oracle DBA工作笔记》中讲性能优化的时候,我花了不少的笔墨做了阐述,结果在做MySQL性能优化的时候,...在表的连接上,半连接,反连接本身很平常,但是统计信息的不够丰富导致执行计划的评估中可能会出现较大差别,会很可能把半连接,反连接的实现方式和执行路径的差异放大,导致SQL性能变差,同时MySQL里面in和...里面的列select_type PRIMARY代表子查询中的最外层查询,此处不是主键查询。而SUBQUERY代表是子查询内层查询的第一个SELECT,结果不会依赖于外部查询的结果集。...从type为ALL代表是全表扫描,所以这样一个查询两个表都是全表扫描,在MySQL内部解析的时候是怎么分解的呢。我们通过explain extended的方式来得到更详细的信息。...所以通过这样一个反连接的小例子,可以看出来存在索引的时候,not in会内部转换为not exists的处理方式,而not exists的方式在存在索引和不存在,两者通过执行计划可以看出很大的差别,其中的一个瓶颈点就在于估算的行数