Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >eggnog-mapper软件的安装配置

eggnog-mapper软件的安装配置

作者头像
用户7010445
发布于 2020-04-01 03:12:58
发布于 2020-04-01 03:12:58
3.4K00
代码可运行
举报
运行总次数:0
代码可运行

之前知道eggnog-mapper这个工具做功能注释很强大,自己也尝试安装过。最开始利用软件中的脚本下载数据库文件,但是速度非常感人。也尝试过其他工具下载数据库文件,如linux下的wget和windows下的Free Download Manager软件。记得当时wget命令下载当时也是非常慢来着。最后是用Free Download Manager软件下载到自己windows电脑,然后再上传到课题组服务器。可是数据库文件非常大,这一步又耗费了好长时间。上传成功后,解压又遇到了问题。自己也不知道问题出在哪里。前前后后大约花了两天时间,加之当时也不着急使用这个软件,遂放弃。前几天看到一位师弟发朋友圈,大体内容是利用这个软件做了注释并构建了自己物种的orgDB。遂 请教之。师弟发给了我他构建自己研究物种的OrgDB用到的代码和安装eggnog-mapper软件的微信文章。

安装软件的微信文章

《使用eggnog-mapper进行功能注释》

数据库文件下载链接

http://eggnogdb.embl.de/download/emapperdb-5.0.0/eggnog.db.gz http://eggnogdb.embl.de/download/emapperdb-5.0.0/eggnog_proteins.dmnd.gz

将数据库文件下载到data文件夹下

这次使用wget命令成功下载,试着运行软件自带数据成功

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
python emapper.py -i test/test_queries.fa --output out -m diamond --cpu 8

这个软件是python2版本的,使用之前我先创建了一个python2的虚拟环境

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
conda create -n emapper python=2.7
conda activate emapper

以上是使用diamond做注释,这个软件还可以使用hmmer做注释,印象里好像还得配置hmmer的数据库。而且这个数据库文件非常大,而且数据库文件有好几个,这里我先不尝试了。

同时这个软件还有一个在线版 http://eggnogdb.embl.de/#/app/emapper

在线版运行也很快,我之前试过两万多条蛋白序列,基本上一个晚上就能得到结果

软件的详细介绍

https://blog.csdn.net/woodcorpse/article/details/83144768

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用 eggnog-mapper 进行功能注释
eggnog-mapper 是一种用于对未知序列进行快速功能注释的工具。它使用 eggNOG 数据库中预先计算好的直系同源基因组和系统发育树,根据其进化关系推断他们的功能信息。eggnog-mapper 一般用于注释新的基因组,转录组亦或是宏基因组数据。
生信菜鸟团
2020/08/28
4.7K0
用 eggnog-mapper 进行功能注释
使用eggnog-mapper进行功能注释
对于许多做非模式生物的同学来说,没有现成的功能注释可用是非常难受的一件事。而blast2go虽然可以一步到位帮你完成功能注释,但它是收费的。这时,我们可以使用eggnog-mapper进行功能注释。
生信小王子
2020/08/10
1.8K0
eggnong数据库本地版注释步骤
❝本节来介绍如何使用「eggnog-mapper」软件来对基因做功能注释,,由于需要注释的基因有10万条,在线版单次只支持5000条序列因此我们使用本地版来进行注释❞ 软件安装 conda install -c bioconda eggnog-mapper 数据库下载 目前版本已经更新到5.0.2下载后解压缩即可 axel -an50 http://eggnog5.embl.de/download/emapperdb-5.0.2/eggnog.db.gz axel -an50 http://eggnog
R语言数据分析指南
2022/09/21
7830
使用clusterProfiler包利用eggnog-mapper软件注释结果做GO和KEGG富集分析
这里我使用 Schizosaccharomyces pombe 这个物种的蛋白数据做例子,搜了一下拉丁名好像是裂殖酵母。
用户7010445
2020/04/01
11.6K1
基因功能注释
背景 预测得到一个物种的全部基因之后,接下来自然而然的问题就出现了。这些基因都有哪些功能呢?这就需要进行基因功能注释。基因功能注释就是将待查基因与已知数据库进行比对,如果比对上则认为二者
生信喵实验柴
2022/10/25
3.2K0
基因功能注释
20220519_生物信息平台搭建及生物信息软件安装
20220519_生物信息平台搭建及生物信息软件安装 01 基础软件安装 基础软件安装 ============================================================================================ #java安装 apt-get install openjdk-8-jdk sudo add-apt-repository ppa:webupd8team/java
wilson_bit
2022/05/19
1.4K0
宏转录组学习笔记(一)
前面提到,已经有两家公司通过宏转录组(Metatranscriptomics)测序检测肠道微生物,面向消费者提供检测服务。对宏转录组充满了好奇,有这样的比方说,宏基因组可以告诉我们这个微生物群落可能有什么样的功能(潜能),宏转录组就是告诉我们群落正在做什么,相比宏基因组的眉毛胡子一把抓,宏转录组是更针对当下的结果。由于测序的目标序列少了很多,结果不是变态大,对计算机的配置要求也相对降低。苦于想学宏基因组暂时没有服务器的我,就退而求其次试试宏转录组了,相信不会让我失望。之前学习过单转录组数据的分析,一般的笔记本(双核,8g ram)扛了下来。鉴于中文网络上能找到的宏转录组教程基本没有,只在Github上搜索到两个,选其中一个学习下。
用户1075469
2020/03/18
1K0
时隔四年,NOG数据库更新啦!
就在前天,我发现EggNOG数据库已经进行了更新,也即EggNOG 5.0,特此分享给大家。与4年前的版本EggNOG 4.5相比,物种数目增加到原来的2.5倍,其中病毒数目增加了8倍,OG数目更是增加了十几倍!还在进行数据分析的小盆友们可以下载新的数据库进行注释啦!
SYSU星空
2022/05/05
1.1K0
时隔四年,NOG数据库更新啦!
eggNOG:从COG延伸出来的同源蛋白数据库
直系同源蛋白的预测在系统发育,比较基因组学等多个领域都占用重要地位,COG数据库开创了同源蛋白数据库的先河,后续又不断有新的数据库涌现,而eggNOG就是目前使用最广泛的数据库之一。
生信修炼手册
2020/05/08
2.1K0
eggNOG:从COG延伸出来的同源蛋白数据库
宏基因组基因功能注释
前言 此部分内容,均为《基因学苑》公众号付费资源的学习笔记。 一、eggnog-mapper简介 拼接完的宏基因组序列,进行基因预测,去冗余,最终得到宏基因组测序的基因组。那么这些基因都
生信喵实验柴
2023/02/24
1.9K0
宏基因组基因功能注释
Elasticsearch 安装配置
限制来自外部的Elasticsearch实例访问活动(端口9200),找到指定network.host的一行,取消其注释并将其值替换为“localhost”:
goodspeed
2020/12/25
4430
Redis从入门到放弃(1):安装配置
Redis是一个高性能的开源key-value数据库。它被广泛应用于缓存、会话存储、实时分析、消息队列等场景。Redis具有以下三个主要特点:
夕阳也是醉了
2023/10/16
2530
lncRNA组装流程的软件介绍之diamond
该程序明确地设计为,利用具有大内存容量和许多内核的现代计算机体系结构。那么为什么它那么快呢,因为它使用了种子和延伸方法。额外的算法成分是使用缩小的字母,间隔种子和双索引。算法简单了解一下就可以了,具体的算法的内容比较难懂就不深入讨论了。
生信技能树
2021/07/06
1.7K0
使用igblast进行免疫组库分析
接下来又认识了免疫组库测序数据,知道了免疫组库测序数据的一些特性,现在就面临免疫组库数据分析流程的搭建啦,这个其实非常复杂, 今天我只能勉强介绍一下使用igblast进行免疫组库分析,希望大家能跟上来。其实igblast这个软件早在六年前我就介绍过,差不多是重新看着自己的教程,一点一滴复现了一遍。真的要吹爆生信技能树和生信菜鸟团教程,极大的便利了生信工程师的工作。
生信技能树
2020/05/29
2.8K0
使用igblast进行免疫组库分析
二代测序宏基因组分析软件安装及数据库下载
1、数据质控:使用 kneaddata 软件,该软件先调用 Trimmomatic 过滤数据,然后利用bowtie2 或 bmtagger 比对宿主数据库去除宿主数据 (也可以去除核糖体数据)。
生信喵实验柴
2023/02/24
2.1K0
二代测序宏基因组分析软件安装及数据库下载
单细胞上游分析/cellranger流程学习(一)
这次来学习一下单细胞数据的上游分析,本次主要集中在环境部署、软件安装和数据下载这三个方面。
凑齐六个字吧
2025/02/12
1680
单细胞上游分析/cellranger流程学习(一)
Nr数据库子库构建
在经过基因组组装或转录组差异基因表达量分析之后,对其结果进行注释是比较重要的一步,如何注释以及如何得到精确的注释结果?
生信菜鸟团
2022/02/17
4K0
Nr数据库子库构建
[Linux] 非root安装Lefse软件及其数据分析「建议收藏」
Lefse软件是宏组学物种研究常用软件,一般大家用在线版本即可。但要搭建在Linux集群环境中有点烦,记录一下折腾过程。
全栈程序员站长
2022/09/01
1.4K0
超简便的国产lncRNA预测工具LGC
在过去几年里,研究发现long non-coding RNAs (lncRNAs)在疾病和生物调控过程中扮演着重要角色。但在大量非模式物种中lncRNA的鉴定仍是一项富有挑战性的工作。该工作需要确定的序列信息,注释信息以及构建物种特有的训练集,但具有lncRNA研究所需的足够完整的序列与注释的物种只占很少数。
生信宝典
2019/05/09
2.2K0
超简便的国产lncRNA预测工具LGC
linux下安装配置redis服务
         最近项目需要用到redis缓存及集群技术,故自己在工作之余抽空研究了一把,其实网上关于redis的安装配置的文章有很多,但总感觉写得不是很完整,容易使人犯晕,
拓荒者
2019/03/16
9040
linux下安装配置redis服务
相关推荐
用 eggnog-mapper 进行功能注释
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验