前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >替代付费生信工程师的在线可视化工具箱Hiplot

替代付费生信工程师的在线可视化工具箱Hiplot

作者头像
生信技能树
发布于 2022-07-26 02:33:58
发布于 2022-07-26 02:33:58
1.1K0
举报
文章被收录于专栏:生信技能树生信技能树

做教程这些年,经常有小伙伴在后台求助我们,希望可以做一个对咱们生信工程师来说是举手之劳的数据分析,所以有了:最低仅需800,就有一个生信工程师为你服务! ,可以看到,都是常规分析,比如:

其实就是难者不会,会者不难 ,毕竟每个人要成为一个能做这些举手之劳分析的工程师,就需要至少一年的努力学习,为大家的学习和付出买单是理所当然的。

不过,近日,生物信息学领域知名国际期刊《生物信息学简报》( Briefings in Bioinformatics)在线发表由国内多家单位/机构/生物信息学开源社区共同开发的一个免费的综合性生物医学数据可视化网站 Hiplot(https://hiplot.org)。里面的涵盖了我们:最低仅需800,就有一个生信工程师为你服务! 的大量分析步骤,尤其是可视化步骤:

出色的可视化环节

绝大部分可视化小工具都吊打一般的的生信初学者了,更让人惊喜的是常规组学数据分析里面的大家喜闻见乐的WGCNA,GSEA等步骤都是被做成了小工具:

小工具

可以说是,完全替代了我们:最低仅需800,就有一个生信工程师为你服务! 的大部分业务,比如:

自 2020 年上线以来,Hiplot 可视化工具箱已提供超过 240 个一键式数据可视化分析插件,涉及基础统计图形、组学和其他常见的生物医学数据可视化分析任务。注册用户近 3 万人,日均任务超 3000 次,谷歌学术网站显示网站链接被引用超 200 次。

而且该在线可视化工具箱Hiplot也考虑到了大家的个性化学习需求,在出美图的同时也会有对应的R代码分享,而且有大量开源教学书籍:

大量开源教学书籍

不过,开箱即用的工具虽然多,但是如果大家要立足于这个数据分析领域,就还是得自己从零开始学习了,起码的计算机基础就无需多言了,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

有了计算机基础,还需要 develop and maintain standard analytical pipelines, and conduct analyses on various large-scale datasets including, but not limited to, Microarray, RNA-Seq, ATAC-Seq, Chip-Seq, and single cell RNA-Seq.

正是因为掌握了如此多的数据分析技能,我们作为开发者才能携手搭建起来这个Hiplot(https://hiplot.org)。

所以,但是相信我,去看看这个免费的综合性生物医学数据可视化网站 Hiplot(https://hiplot.org),觉得是不虚此行。

自 2020 年上线以来,Hiplot 可视化工具箱已提供超过 240 个一键式数据可视化分析插件,涉及基础统计图形、组学和其他常见的生物医学数据可视化分析任务。注册用户近 3 万人,日均任务超 3000 次,谷歌学术网站显示网站链接被引用超 200 次。

背景

与几十年前相比,生物学/生物医学与计算科学之间的直接联系正变得越来越紧密。多维数据可视化技术,如现代统计图形和组学数据可视化,已成为生物医学数据挖掘中不可或缺的技术手段,对于提高相关数据分析结果的可解释性、可重复性和正确性有重要意义。研究人员通常可以通过三种方式进行生物医学数据可视化,包括传统的商业桌面程序、编程语言/库和在线网页工具。作为数据分析任务中的关键步骤之一,生物信息学家和其他专门的数据分析人员通常会使用编程语言(如R、Python库/工具箱)来绘制高质量和可供出版的可视化图形。然而,对于缺乏编程技能的生物学家和临床医生来说,基于命令行工具来产生高质量的可视化分析图表仍然相对困难。在此背景下,基于现代网页技术的生物医学数据可视化工具在科学社区正变得越来越流行。十多年前,用户大多只能通过商业化桌面程序来进行日常的科研数据可视化分析。近年来,用户友好的在线网页工具已逐渐成为复杂生物医学数据深度挖掘的理想选择。随着知名的生物信息学云平台的建立,如 Galaxy 和 DNAnexus,一些常见的组学数据上游分析任务已经相对简化,比如序列比对、突变检测和基因组表观调控分析。然而,生物医学数据的下游分析功能,特别是可发表级别的科学图形和交互式数据挖掘,在已有的网站上仍然非常缺乏。

知名的生物信息学云平台 Galaxy 提供了非常有限的生物医学可视化任务插件,使用方法上也相对繁琐,且未针对基于表格的轻量级可视化分析任务进行相应优化。美国圣裘德儿童研究医院组学数据中心的可视化模块为癌症基因组学提供了 20 个基于 JavaScript 的在线可视化分析插件,但其基础科学数据可视化功能仍然空白。另外一个已发表的 ImageGP 网站,自 2017 年以来仅开发了 16 个用于科学数据可视化的在线分析插件。

针对用户提出的不同可视化分析需求,仍有大量工作需要科学社区共同努力完成。目前,复杂的用户接口和不方便的网站使用方法是用户放弃在线网页工具的首要因素。在已有的生物信息学在线分析工具中,很少有可以像桌面软件那样直接支持使用电子表格来预览和编辑数据。而自动化组合和排版多个图形的常用功能大多被忽视。其他一些功能特性方面的不足,如可视化任务输出不及时,参数/结果重现不方便,以及缺乏跨平台和易于使用的命令行程序,也可能会阻碍在线可视化分析网页工具的广泛应用。如何简化用户和开发者的使用和开发工作流程以提高效率已成为该领域的主要挑战之一。它依赖整体网站设计中各个部分的优化,并需要实现可以提高生产力或减少时间花费的核心功能特性。主要包括提供良好设计的用户网页客户端/命令行界面(CLI)程序,高质量的任务输出,高效的基础任务,数据/参数/结果/错误的简易再现,以及必要的用户支持服务。另外,为了提高任务插件的可用性和定制化程度,相关工具需要在团队的长期维护和支持下不断测试和更新。同时,一个聚焦于可视化数据分析相关任务的协作社区将可以推动高质量生物医学数据综合可视化工具的长期建设和复杂在线应用的构建、测试和持续更新。

Hiplot 可视化分析工具箱(240+)

研究者之前发起了一个跨学科的生物信息学协作社区,Openbiox,并在这项工作中共同建立了一个新兴的易于使用和可扩展的在线网页分析工具,Hiplot(https://hiplot.org)。据我们所知,这是目前最大规模的社区驱动的协作尝试之一,以期建立一个免费的网页服务来辅助高质量、发表级别的综合性生物医学数据交互式可视化分析工具。大多数现代统计图形已经在这个网页服务中实现。用户可以使用这个网站上的开放工具来进行日常的生物医学数据可视化分析,比如进行数据的相关性、分布、百分比、演变、流动关系、排名和空间特征分析,且不受操作系统和软件环境的限制。该网站还提供了与组学和临床数据分析相关的可视化功能则可以进一步辅助生物医学和生物学领域的研究人员开展相关研究工作。特别地,利用该网站提供的一键式分析工具,用户可以自由探索癌症多组学数据集、基因组结构、染色体分布、遗传变异、群体遗传学、基因表达谱、基因通路富集和肿瘤微环境(TME)。与此同时,他们还提供了许多基于机器学习的可视化分析功能,包括无监督聚类、降维算法(dimensionality reduction algorithm,DRA)、线性/非线性回归、荟萃分析(meta-analysis)、生存分析和风险模型等,帮助用户关联其他临床特征,建立临床预测模型等。

自 2019 年 10 月以来,Openbiox 生物信息学社区和 Hiplot 开发协作小组已实现了数百个与生物医学数据可视化分析挖掘相关的网页插件,可以辅助科研人员完成大量之前只能由高级生物信息学家/数据分析人员完成的发表级别可视化图形。网站上已部署的可视化插件可以为生物医学数据挖掘提供一个重要而有用的免费在线资源。同时,该论文还提供了一系列基准测试结果可以为相关工具的性能评估和优化工作提供参考数据。生物信息学/生物医学研究人员以及其他缺乏编程技能的数据科学家将可以从这个新兴的免费可视化工具中长期受益。

Openbiox 生物信息学开源社区成员为该网站维护和贡献了大量插件,且相关工具完全开放和免费使用,部分源代码已在 GitHub 开源(https://github.com/hiplot)。另外,该项目相关开发人员已开始新一轮生物信息学项目建设,希望未来可以持续召集生物信息学同行共同建设更多类似的高质量项目。

引用方式

Hiplot: a comprehensive and easy-to-use web service for boosting publication-ready biomedical data visualization,Briefings in Bioinformatics, 2022;, bbac261,https://doi.org/10.1093/bib/bbac261

作者简介

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Hiplot 在线绘图工具的本地运行/开发库开源
Hiplot 项目发起于 2019 年,是由国内生物信息学开源社区 Openbiox 和多家单位和机构共同建设的一个免费、易用、部分开源的综合在线绘图系统(生物医学为主)。截至目前,该网站已提供超过 230+余个在线可视化分析功能,涵盖了基础科研绘图、组学可视化和部分临床模型可视化功能。总的注册用户已超过 2 万 5 千人,总访问量超过 300 万次,每日任务数已超 4000 余次。
王诗翔呀
2022/06/27
8120
Hiplot 在线绘图工具的本地运行/开发库开源
5000万数量的单细胞工作里程碑
这个Chan Zuckerberg CELLxGENE (CZ CELLxGENE) 是由Chan Zuckerberg Initiative(CZI)支持的一个生物信息学工具,旨在促进单细胞基因表达数据的分析、可视化和共享。CZI是由Facebook创始人马克·扎克伯格和他的妻子普莉希拉·陈(Priscilla Chan)于2015年创立的慈善机构,其使命之一是推动生命科学研究领域的技术创新和数据共享。
生信技能树jimmy
2023/09/24
2890
5000万数量的单细胞工作里程碑
生信分析的本手妙手俗手
对于初学者而言,应该从本手开始,本手的功夫扎实了,棋力才会提高。一些初学者热衷于追求妙手,而忽视更为常用的本手。本手是基础,妙手是创造。一般来说,对本手理解深刻,才可能出现妙手;否则,难免下出俗手,水平也不易提升。
生信技能树
2022/07/26
7000
生信分析的本手妙手俗手
Hiplot绘图项目(无需R语言就可以上车高颜值图表)
但不可能人人都有时间和精力系统性学习咱们生物信息学,Hiplot项目为这些无法抽空学习R语言的小伙伴提供了一个解决方案!
生信技能树
2020/09/22
3K0
高维数据可视化必备图形-平行坐标图
如果我们想比较某个数值在不同分组之间的变化差异。或者随着时间序列的变化趋势,往往会用到折线图。折线图是在我们的科研绘图当中最为常用的图形之一。
用户6317549
2020/08/17
2.6K0
高维数据可视化必备图形-平行坐标图
Hiplot 预印本发布:辅助生物医学数据可视化
Hiplot 绘图网站预印本文章近期已作为预印本在 bioRxiv 发布,欢迎大家进行引用。截至目前,网站已提供至少 230+ 数据可视化分析工具,涉及基础数据统计、组学和其他常见的生物医学数据可视化功能。过去的一年时间中,该网站被访问超过 2 百万次,超过 2 万名用户进行注册。
生信技能树
2022/07/26
3680
Hiplot 预印本发布:辅助生物医学数据可视化
基因家族分析(6) 一行代码完成基因结构分析及可视化
R语言数据分析指南
2023/11/07
6360
基因家族分析(6) 一行代码完成基因结构分析及可视化
生信爱好者周刊(第 29 期):Hiplot开发库开源
Hiplot 项目发起于 2019 年,是由国内生物信息学开源社区 Openbiox 和多家单位和机构共同建设的一个免费、易用、部分开源的综合在线绘图系统(生物医学为主)。截至目前,该网站已提供超过 230+余个在线可视化分析功能,涵盖了基础科研绘图、组学可视化和部分临床模型可视化功能。总的注册用户已超过 2 万 5 千人,总访问量超过 300 万次,每日任务数已超 4000 余次。
王诗翔呀
2022/06/27
6160
生信爱好者周刊(第 29 期):Hiplot开发库开源
送给你一份《生信入门指南》
生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题。但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程序。也许你可以跟着一个测序分析流程完成操作,但不懂得背后的原理,不知道什么参数需要修改,结果可以出来,却把握不住对还是错。
科研菌
2020/07/15
2.4K0
送给你一份《生信入门指南》
生信爱好者周刊(第 18 期):过去50年最重要的统计学思想是什么?
3、Nature Communications | 超低频变异低深度检测技术——QBDA,助力MRD液体活检实现精准定量
王诗翔呀
2022/03/30
4330
生信爱好者周刊(第 18 期):过去50年最重要的统计学思想是什么?
可视化工具solo show
本文介绍了一种用于数据可视化的交互式工具,该工具可以生成各种图形和图表,包括热力图、树图、网络图、饼图等等。该工具基于Go语言和Echarts库开发,支持多种数据源,包括数据库、Excel、CSV、JSON等,可以快速生成交互式图表,并支持自定义图表样式、颜色、字体等。该工具还支持云端部署和分享,可以在浏览器中直接运行,无需安装任何插件。本文主要介绍了该工具的功能和特点,以及使用方法和技术实现。
JackieZheng
2018/01/08
2.1K0
2021 Single Cell Genomics Day 直播录屏B站资源
当晚,我在我们单细胞天地的各个交流群通知了大家记得录屏,毕竟按照往年惯例每次放出的recording都是不全的 , 今天终于在B站看到了全部的超高清录屏,真爽:
生信技能树jimmy
2021/04/16
7940
2021  Single Cell Genomics Day 直播录屏B站资源
生信入门第1课
我写公众号的最初目的就是督促自己学习,分享一些教程,和专门搞生信的大佬们比起来,自己也就是菜鸟一枚,公众号更新也比较佛系,也不做推广,你能自行关注到,完全靠缘分。我就是分享一些生信基础的生信分析技能,以满足大家在科研工作中的生信需求。说实话,大家需要给你自己以定位,自己做纯生信的还是只是借助生信为大家在湿实验中提供思路,或者文章中添加一些生信内容。如果你是做纯生信,那也是分档次和研究方向的,如果只是分析别人的数据,比如预后模型这种,属于比较低端的水平。有的做开发,比如开发一个R包或者一些其他生信分析工具,又或者是建数据库,这些属于开发类。另外,这个也和研究领域有很大关系,植物的,人的,微生物的,是有区别的,当然,很多基础工具都差不多,但需要相关的知识背景。我自己主要是做药,癌症,所以我会的技能主要和自己研究方向相关的,我也不是什么都掌握,因为我觉得,具备基础知识储备后,自己用到什么就去现学现卖,而不是一下子学会很多东西等着以后用,我个人认为这是效率极其低下的。
DoubleHelix
2022/06/13
8910
生信入门第1课
生信分析的过去(R语言)、现在(Python)和未来(云平台)
在组学数据分析中,R 语言和 Python 哪个更好?此外,越来越多的生信云平台又为我们的研究提供了哪些新的可能?
简说基因
2024/12/23
3380
生信分析的过去(R语言)、现在(Python)和未来(云平台)
PRISM软件下载,PRISM生物学可视化分析软件 9.5中文版下载安装
PRISM(原名 GraphPad Prism)是一款专业的数据分析和可视化工具软件,广泛应用于生物信息学领域。它以直观、高质量、易于操作的特点,深受生物信息学研究人员的欢迎。本文将对PRISM软件的基本功能、使用方法及其在生物信息学研究中的应用进行详细介绍。
用户10413399
2023/04/13
4020
ChatGPT插件的优缺点
虽然西弗吉尼亚大学的研究人员看到了最新的官方ChatGPT插件——名为“代码解释器”( Code Interpreter)的教育应用潜力,但他们也发现,对于使用计算方法处理针对癌症和遗传疾病的定向治疗的生物数据的科学家来说,这款插件的使用存在限制。
生信宝典
2023/09/12
2410
ChatGPT插件的优缺点
生物信息学软件之网页工具和在线数据库
生物信息学领域有许多在线工具和资源,这些工具提供了各种分析和可视化功能,无需用户进行大量的本地安装和配置。而且绝大部分都是大机构开发和维护,知名度比较好的大机构包括:
生信技能树
2023/11/24
8550
生物信息学软件之网页工具和在线数据库
Rstudio:强大的R语言集成开发环境(IDE)
如果你在生物信息学或统计学领域工作,R语言几乎是必备的工具之一。而RStudio,作为R语言最流行的集成开发环境(IDE),为数据分析、可视化和编程提供了非常友好的平台。今天我们来介绍一下RStudio,特别是它在生物信息学中的作用。
简说基因
2024/12/23
5100
Rstudio:强大的R语言集成开发环境(IDE)
生信爱好者周刊(第 2 期):生信的境界与道路
本杂志开源(GitHub: ShixiangWang/weekly[1]),欢迎提交 issue,投稿或推荐生信相关内容。
王诗翔呀
2021/09/24
1.4K0
R语言、Python、云平台!生信分析的过去、现在和未来
在组学数据分析领域,R语言和Python各有千秋,而生信云平台则为研究提供了前所未有的可能性。那么,哪种工具更适合你的科研需求呢?
用户11203141
2025/03/06
1420
R语言、Python、云平台!生信分析的过去、现在和未来
推荐阅读
相关推荐
Hiplot 在线绘图工具的本地运行/开发库开源
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档