前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2024-03-05数据挖掘答疑

2024-03-05数据挖掘答疑

作者头像
生信技能树
发布2024-06-08 08:23:36
1020
发布2024-06-08 08:23:36
举报
文章被收录于专栏:生信技能树生信技能树

下面是优秀实习生的整理和分享

Q1:要怎么处理呢

A1:安装缺失的那个包即可

Q2:安装完缺失的包,跑library那一列还是很多error

A2:BiocManager::install("GenomeInfoDbData") 安装提示信息里的R包,缺失哪个包报错就用这个命令装对应的包

Q3:重新下载了r语言选了english为啥还是看到中文呀

A3:不用担心哈,应该大部分是英文比如报错提示信息啊,只有少数的中文

Q4:老师,请问M1芯片下载R是不是最好还是选择intel的那个版本?(依稀记得之前选的M1芯片版本装包好像会有问题

A4:是的,用Intel的

Q4:老师好,脚本中用#号标注后,怎么形成 top level 里的目录?

A5:那应该是用的rmarkdown,然后可以形成没有理由

Q6:老师好,这个BiocManager的包一直安装不上,用测试代码download.file可以下载的,切换镜像也没有用

A6:这个报错的可能原因是,你所使用的网络环境,在访问清华镜像的时候存在问题,可以尝试换个网络环境,或者换个镜像源;

代码语言:javascript
复制
# 运行这两句代码设置一下北外镜像
options("repos"= c(CRAN="https://mirrors.bfsu.edu.cn/CRAN/")) 
options(BioC_mirror="http://mirrors.bfsu.edu.cn/bioconductor/")

Q7:想问下这样我赋值为什么会输出这种结果

A7:相当于是连续指令,这个指令意思是 x 赋值为 1,再连续输出 5,7,8,所以就只输出 5,7,8 了

Q8:“|”放的位置为啥不行?还是没明白出现“|”时,运算顺序是怎样的

A8:算不出来,所以没什么顺序了,任何代码的顺序都是有嵌套的话就从里到外,没有嵌套就从左到右。

Q9:为dataframe赋值这里为什么= 和 <- 是有区别的嘞?我看help文档里也是用<-赋值

A9:

Q10:请问之前讲从列表取单个元素,想一次取多个应该怎么做呢?好像有点问题

A10:一个中括号

Q11:想问一下上课讲的这个16,-6是咋数出来的

A11:有个函数叫str_locate

Q12:这个怎么解决

A12:GO.db是一个R包,需要装它,仿写你运行的脚本里面BiocManager开头的代码,把引号里面的词换成GO.db就行

Q13:请问使用镜像是什么原因呀?

A13:提高下载速度

Q14:这个BiocManager的包一直安装不上,用测试代码download.file可以下载的,切换镜像也没有用

A14:这个报错的可能原因是,你所使用的网络环境,在访问清华镜像的时候存在问题,可以尝试换个网络环境,或者换个镜像源

代码语言:javascript
复制
# 运行这两句代码设置一下北外镜像
options("repos"= c(CRAN="https://mirrors.bfsu.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.bfsu.edu.cn/bioconductor/")

也有可能是网络问题

Q15:想问下这样我赋值为什么会输出这种结果

A15:相当于是连续指令吧,这个指令意思是 x 赋值为 1,再连续输出 5,7,8。加个 c 。

Q16:老师,“|”放的位置为啥不行?

A16:任何代码的顺序都是有嵌套的话就从里到外,没有嵌套就从左到右,

Q17:请问之前讲从列表取单个元素,想一次取多个应该怎么做呢?好像有点问题

A17:一个中括号

Q18:上课讲的这个16,-6是咋数出来的

A18:有个函数叫str_locate

Q19:这个是什么原因呢

A19:代码本身是没有问题的,是不需要修改代码的。你之所以画不出来,其实是因为你的iris被你改动掉了,这个改动重启就可以解决

Q20:这个包怎么都安不上

A20:用这个代码

代码语言:javascript
复制
install.packages("https://mirrors.tuna.tsinghua.edu.cn/bioconductor/packages/release/data/annotation/src/contrib/BSgenome.Hsapiens.UCSC.hg19_1.4.3.tar.gz",type = 'source',repos = NULL) 

Q21:

A21:用哪个都可以的,就是用全部基因更费计算资源,官网用的是所有基因,默认参数是高边基因,所以都可以.

Q22:我们做差异分析时不是说期望数据均为正值吗?我看GSVA分数的差异分析沿用的是基因差异分析的代码,不得其解的是这是怎么实现的?

A22:gsva官方文档就用了limma做差异分析,所以完全是没问题的.富集分数矩阵和基因表达矩阵有异曲同工之妙,limma也不是只能给芯片用

Q23:脚本中用#号标注后,怎么形成 top level 里的目录?

A23:那应该是用的rmarkdown,然后可以形成没有理由

Q24:一开始我下载的r包按照步骤挺好滴,昨晚上课老师说如果是中文可以重新下载一下,最好改到英文,我重新下载之后安装r包就有30个包了,这正常嘛?我看视频上需要二百多个包

A24:正常的

Q25:

A25:这是R包兼容问题,需要安装特定版本的Matrix包,提示信息里有

Q26:为什么老师你在昨天的数据过滤中,要查看开头为MT 的细胞的百分比?“(pbmc,pattern = “^MT-)”, 开头为mt的细胞是什么

A26:MT表示线粒体基因,排除线粒体基因高表达的异常细胞

Q27:

A27:waring提示信息不用在意,主要关注error.

Q28:我的数据是十个亚群,KEGG和ReactomePA及Go出来的有的只有九个亚群或者八个亚群的富集分析,是因为有的亚群富集不到吗?

A29:是

Q30:

A30:版本冲突了。最开始读取矩阵的时候有问题。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档