首页
学习
活动
专区
圈层
工具
发布

R语言利用转录组基因表达矩阵做基因共表达分析的学习资料推荐

v1.0.1 提供完整的示例数据和代码,非常好的学习材料 做基因共表达比较常用的是WGCNA那个R包,这个链接里提供的代码不是用WGCNA这个R包实现的,而是利用表达量数据计算不同基因之间的相关性,这种方法也挺常用的在论文里见过...gene_ID, names_to = "library", values_to = "tpm") %>% mutate(logTPM = log10(tpm + 1)) head(Exp_table_long...(Run = row.names(.)) %>% full_join(Metadata %>% select(Run, tissue, dev_stage, `Library...以上用到的代码和示例数据都可以在推文开头提到链接里找到 上面的代码有一步是对TPM值 加1然后取log10,他的实现方式是先将宽格式数据转换为长格式,然后把取log10后的长格式再转换为宽格式,这里我没能还可以借助mutate_at...()函数 Exp_table %>% select(1,2,3) %>% rename("gene_id"="...1") %>% mutate_at(vars(starts_with("SRR

63510
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

    从一般数据科学的角度来看,FF 将 CAPM 的简单线性回归(我们有一个自变量)扩展到多元线性回归(我们有许多自变量)。...当我们将投资组合的收益率与HML因子进行回归时,我们正在调查有多少收益是由于包括高账面市值比率的股票(有时被称为价值溢价,因为高账面市值的股票被称为价值股票)。...Gloa\_3\_Fars <- read_csv(unz %>% rename%>% mutate_at head(Gloa\_3\_Fars ) 现在我们的因子有了数字数据,日期列有更好的标签...Gll\_3\_ts <- read_csv %>% rename %>% mutate_at%>% mutate head(Gll\_3\_ts ) 日期格式很重要,因为我们想要修剪...Glb3Ftos <- read_csv(unz %>% rename%>% mutate_at %>% mutate) + months) %>% filte head

    4.6K30

    35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

    arrange(test, Sepal.Length)#默认从小到大排序 arrange(test, desc(Sepal.Length))#用desc从大到小 arrange(test, desc(...2.8 mutate 可以为数据框计算新变量,返回含有新变量以及原变量的新数据框: mutate(test, new = Sepal.Length * Sepal.Width) > head(test,...也可以用来添加新列,结合我先前说过的新增列的种种方法,并且支持多个语句组成的复合语句: > d.class %>% mutate(sexc = { + x <- rep(" 男", length(sex...)) + x[sex == "F"] <- " 女" + x + }) 其中复合语句中也可以简化的调用数据框的列。...extract 除了seperate 外,函数 extract() 可以按照某种正则表达式表示的模式从指定列拆分出对应于正则表达式中捕获组的一列或多列内容。

    13K30

    R tips:使用glmnet进行正则化广义线性模型回归

    什么是广义 最开始接触的线性回归的思想是从最小二乘法解决一个连续响应变量y和一个连续预测变量x发端,也就是一元线性回归,这种情况还是非常常见的,比如测定物质浓度时常用的标准曲线就是拟合一个浓度和吸光度的模型...如果响应变量也不是连续变量,又要如何解决?这种情况下,同样会编码变量成哑变量,然后使用特定的连接函数来处理它,将其处理为连续变量。...lambda值 cv_model_ls <- alpha_seq %>% set_names(., .) %>% # 对向量添加names为自身,保证map返回的列表也是有names的 map...,见下图,从错误度量来说,alpha=1时的模型最佳,具有最低的错误程度。...% map(as_tibble) %>% enframe(name = "alpha") %>% unnest(value) %>% mutate(lambda = log(lambda

    5.1K11

    优化算法——遗传算法

    与遗传算法的第一次接触 遗传算法是我进入研究生阶段接触的第一个智能算法,从刚开始接触,到后来具体去研究,再到后来利用遗传算法完成了水利水电的程序设计比赛,整个过程中对遗传算法有了更深刻的理解,在此基础上...遗传操作设计 遗传操作主要包括:选择(selection)、交叉(crossover)、变异(mutation),遗传操作的主要目的是从当前的群体中产生新的群体,这样便能使得产生新的更优的个体。...交叉(crossover) 交叉操作也称为杂交,其目的是产生新的个体。 对于二进制编码方式,主要有单点杂交和多点杂交。...首先通过Matlab得到的函数图像大致如下,从图像中可以观察到当n=2n=2时,我们可以在(0,0)(0,0)附近取得函数的最小值。 ?...轮盘赌的选择策略是一种基于适应值比例的选择策略,适应值越大被选择到下一代的概率也会越大。

    4.4K61

    听说WGCNA官网崩了?那还能做基因共表达分析吗?

    gene_ID, names_to = "library", values_to = "tpm") %>% mutate(logTPM = log10(tpm + 1)) head(Exp_table_long...ggsave("PCA_by_stage_tissue.png", height = 3.5, width = 8.5, bg = "white") 现在x轴(PC2)明显区分了发育阶段:从左到右,从年轻到老年...我将这一步称为“边的选择”,其中每个基因是一个节点,每个相关性是一条边。我有两种方法可以做到这一点。...Empirical determination using rank distribution t分布近似 t distribution approximation 我们有我们有84个独特的组织-阶段组合样本,从...也可以绘制整个边表,当你抽样足够大时,它不会改变分布的形状。看起来在 r>0.7(红线)时,分布迅速减少。因此,使用 r>0.7r作为截止值。

    63610

    遗传算法解决TSP问题MATLAB实现(详细)

    TSP问题也称为货郎担问题,是一个古老的问题。最早可以追溯到1759年Euler提出的骑士旅行的问题。1948年,由美国兰德公司推动,TSP成为近代组合优化领域的典型难题。...随机性较强,因而也较公正 二是某些先验知识可转变为必须满足的一组要求,然后在满足这些要求的解中在随机地选取样本。这样选择初始种群可使遗传算法更快的达到最优解。...选择 一般地说,选择将使适应度较大(优良)个体有较大的存在机会,而适应度较小(低劣)的个体继续存在的机会也较小。...这样就实现了个体编码的变异,算法如下: 产生两个0到1之间的随机实数; 将这两个随机实数转化为0到n(城市数)-1之间的随机整数; 将这两个随机整数指代的城市进行交换; 流程图 ?...本次实验采用的是部分匹配交叉,先从第一个父代选出一个偏移量,从偏移量后的部分点加入到子代,接下来从第二个父代选择第一代没有选择的部分点移到子代中。

    5.7K31

    分析复联系列电影台词,看看每个英雄说得最多的词是什么

    作为漫威的路人粉C君也回顾起之前的漫威电影,本文中我们选取了漫威电影中的中英雄出现交叉度较高的三部代表作《复仇者联盟》、《复仇者联盟2:奥创纪元》和《美国队长3:内战》的剧本,对每个英雄最爱说的词进行了分析...从2008年开启漫威宇宙的《钢铁侠》到2019年的《复联4》,钢铁侠也从开始的花花公子,一步步成为复联中的领袖。最后只想说,钢铁侠,我爱你三千遍。 ? 美国队长:铁盾情深 ?...蜘蛛侠从一开始的拥有远大抱负、想要肩负起拯救世界的重任,到发现自己的能力不足而放弃,最终从“能力越大,责任越大”,到重新认识自己、看清自己的位置。这是他成为超级英雄的成长过程,也是他的可爱之处。...这确保每个角色对应条目;一个是实际数值,另一个是数值的结束点,扩展到共同的最大值,即余数。...all_plots names, plot_char) 从图中提取轴标题 get_axis_grob <- *function*(plot_to_pick, which_axis

    1.3K40

    原来R还可以这么玩!

    最近逛Rstudio和ggplot2官网意外发现了一个有趣的网站,原来R的可视化还可以到这样的地步。虽然说这些图不能带来任何可用的信息和价值。但是用编程生成一些类似“艺术”的,令人愉悦的图形。...下面是一些从R和ggplot2构建的数据艺术,来源于The R Graph Gallery https://www.r-graph-gallery.com/ggplot2-package.html R艺术案例...seq_along(args), FUN = function(x) { Polygons(list(Polygon(as.data.frame(args[[x]]))), names...panel.background = element_blank()) gg1 以及一些令人叹为观止的艺术照: https://www.data-to-art.com/ 该网站都是用R绘制的艺术照,但是没有公开代码,网站也还在开发...大家可以欣赏下,真希望以后的我也可以用R代码做出一张nice的艺术照。 下面放上网站的一些截图。 ? ? ?

    1K30

    遗传算法的应用实例python实现_python遗传算法库

    从名字来看,遗传算法借用了生物学里达尔文的进化理论:”适者生存,不适者淘汰“,将该理论以算法的形式表现出来就是遗传算法的过程。...通过交叉子代获得了一半来自父亲一半来自母亲的DNA,但是子代自身可能发生变异,使得其DNA即不来自父亲,也不来自母亲,在某个位置上发生随机改变,通常就是改变DNA的一个二进制位(0变到1,或者1变到0)...交叉概率,范围一般是0.6~1,突变常数(又称为变异概率),通常是0.1或者更小。...= np.random.randint(0, DNA_SIZE) #随机产生一个实数,代表要变异基因的位置 child[mutate_point] = child[mutate_point]^1 #...= np.random.randint(0, DNA_SIZE*2) #随机产生一个实数,代表要变异基因的位置 child[mutate_point] = child[mutate_point]^1

    2K40
    领券