Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >生信不好找工作可能是因为你点错了技能树

生信不好找工作可能是因为你点错了技能树

作者头像
生信技能树
发布于 2024-11-21 03:21:06
发布于 2024-11-21 03:21:06
16900
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

学员表示在参加完我们的马拉松授课后,已经能掌握了我们两个月传授的表达量相关的数据分析

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
目前能完成以下分析
## Bulk data
数据清洗,各种注释 (ensemble, entriz, symbol id 转换)
差异分析:deseq2, limma, edgeR, wilcoxon, t-test
富集分析: ORAGSEA
通路差异:GSVA
免疫浸润:IOBR8 种免疫浸润算法。肿瘤微环境分析(stromal score, immune score, 肿瘤纯度)
药敏分析:pRR 与 oncopredict, 以及基于 cellMiner 数据库的相关性分析
相关性分析:pearson, spearman
机器学习相关:logistic, lasso, 单因素/多因素 cox, RSF, log-rank, K-M 生存曲线,最佳 cutoff 的选择,  (筛选变量和模型比较一般用 101 种模型组合)ROC 曲线绘制,  非线性模型:RCS
免疫治疗: 基于 imvigor210 队列来建模,根据自己项目中的 risk score 来预测免疫治疗效果 (与药敏分析的极其类似)
WGCNA: 建立表型&基因模块的相关性图,以及筛选 hub gene

## 单细胞
降维分群,以及细分亚群(包含了质控,降维,去批次等基本流程)
Decontex 去除污染细胞
利用基因集打分: AUCell, ucell, addmodulescore
ScMetabolism:代谢通路分析
差异基因:findallmarkers, 以及 SCP 包里的 RUNDEtest
ORA, GSEA 富集分析, GSVA(差异通路)
Monocle2 拟时序
Cellchat
Pyscenic 结合 scenic 。转录调控网络构建;方差分解
palantir 拟时序,并筛选影响differention potential & Branch potential的因子,区分该gene module的dynamic pattern

但学员认为这些数据分析还是偏向于科研文章了,继续在这些技能上面提高熟练度也仅仅是去科研服务公司!所以我让他完成我的一些练习题,被拒绝了:

学员提出来了一个灵魂拷问:对于想从事生信行业,想找工作的新手说还能从哪些角度提高自己的生信能力呢呢?比如联合其他技术,使数据量更大、更脱颖而出。

其实我非常理解学员的想法,作为新手很容易沉浸在掌握某些R包或Pipline的成就感中,特别是当身边的人都不太会的时候。但假如自己不是数学或统计学背景出身,或不打算在将来花费大量时间精力去学习数学和统计学。那么我们对编程语言掌握的天花板也就在哪里了,只是会使用一些工具或流程而已。也就是说,我们的技能只是一个工具,如果要进一步突破,那么方向就是自己对生物学问题的理解。

对于新手一方面要掌握更多的分析方法,提升自己的技能。但另一方面,更为重要的是去观察这些数据在文章中到底放了那些分析的结果,在文章中证明了什么,对文章的逻辑有什么贡献。只有这样才能对生信对生物学问题的贡献度的理解。所以数据量多么大,技术多么花哨来脱颖而出永远不是目的,目的永远应该是对生物学问题的解答可靠。

如果是找生信工程师工作(医疗大健康行业)

上面的理解偏重于科研行业相关的岗位,比如各个课题组的研究助理,各个科研服务公司的售前售后生信工程师等等。很多小伙伴可能是想干一些医疗大健康行业的生信工程师,希望我们的生信数据分析能力可以在一些药企,IVD行业发光发热。因为生物信息学对于药企、IVD行业、肿瘤早筛和肿瘤疗法开发等领域的技术进步和创新至关重要。它不仅有助于提高疾病诊断的准确性,还能推动个性化医疗和精准治疗的发展 :

  1. 药企和肿瘤疗法开发
    • 在药企中,生物信息学被用于药物研发的多个阶段,包括药物靶点的识别、药物作用机制的解析、药物反应的预测以及药物安全性评估。例如,通过分析基因表达数据,可以识别与特定疾病相关的生物标志物,这对于开发新的治疗药物至关重要。此外,生物信息学工具也用于分析药物与蛋白质之间的相互作用,这对于设计新药和理解药物作用机制非常重要。
  2. IVD行业
    • 在体外诊断(IVD)行业中,生物信息学的应用正在增长。IVD技术,特别是在分子诊断领域,依赖于生物信息学来分析和解释大量的遗传数据,以实现疾病的早期诊断和精准医疗。例如,通过分析患者的基因组数据,可以识别特定的遗传变异,这对于个性化医疗和精准诊断至关重要。
  3. 肿瘤早筛
    • 在肿瘤早筛领域,生物信息学被用来分析液体活检样本中的生物标志物,如循环肿瘤DNA(ctDNA)和循环肿瘤细胞(CTCs)。这些分析有助于早期发现癌症,甚至在症状出现之前。例如,通过分析血液中的ctDNA甲基化模式,可以识别早期癌症的存在。生物信息学工具也用于提高信噪比,从复杂的生物信息中提取出与肿瘤相关的信号。
  4. 肿瘤疗法开发
    • 在肿瘤疗法开发中,生物信息学被用于识别新的治疗靶点、预测药物反应和评估治疗效果。通过分析肿瘤基因组数据,可以发现肿瘤特有的突变和表达模式,这对于开发针对性的治疗方法至关重要。此外,生物信息学也被用于开发和验证预测模型,以预测患者对特定治疗方案的反应。

然后大家会发现,科研技能基本上派不上用场,或者说我们的马拉松授课科研技能太底层了。对于工业界来说,深度完全不够。这就是因为生信不好找工作可是点错了技能树,推荐大家看一下这个2020的书籍:《Bioinformatics for Cancer Immunotherapy》,相信神通广大的小伙伴们是可以自己找到这个书籍的pdf文件。不过呢,对绝大部分还处在科研界的小伙伴来说,这个书籍里面的技能其实没啥子用。

以下是书籍《Bioinformatics for Cancer Immunotherapy》的目录,包括各章节的标题和中文翻译:

  1. Bioinformatics for Cancer Immunotherapy 生物信息学在癌症免疫疗法中的应用
  2. An Individualized Approach for Somatic Variant Discovery 个体化体细胞变异发现方法
  3. Ensemble-Based Somatic Mutation Calling in Cancer Genomes 基于集成的癌症基因组体细胞突变呼叫
  4. SomaticSeq: An Ensemble and Machine Learning Method to Detect Somatic Mutations SomaticSeq:一种检测体细胞突变的集成和机器学习方法
  5. HLA Typing from RNA Sequencing and Applications to Cancer 基于RNA测序的HLA分型及其在癌症中的应用
  6. Rapid High-Resolution Typing of Class I HLA Genes by Nanopore Sequencing 通过Nanopore测序快速高分辨率分型I类HLA基因
  7. HLApers: HLA Typing and Quantification of Expression with Personalized Index HLApers:个性化指数的HLA分型和表达量量化
  8. High-Throughput MHC I Ligand Prediction Using MHCflurry 使用MHCflurry进行高通量MHC I配体预测
  9. In Silico Prediction of Tumor Neoantigens with TIminer 使用TIminer进行肿瘤新抗原的计算机预测
  10. OpenVax: An Open-Source Computational Pipeline for Cancer Neoantigen Prediction OpenVax:一个开源的癌症新抗原预测计算流程
  11. Improving MHC-I Ligand Identification by Incorporating Targeted Searches of Mass Spectrometry Data 通过结合靶向质谱数据搜索改进MHC-I配体鉴定
  12. The SysteMHC Atlas: a Computational Pipeline, a Website, and a Data Repository for Immunopeptidomic Analyses SysteMHC图谱:一个用于免疫肽组学分析的计算流程、网站和数据存储
  13. Identification of Epitope-Specific T Cells in T-Cell Receptor Repertoires 在T细胞受体库中识别表位特异性T细胞
  14. Modeling and Viewing T Cell Receptors Using TCRmodel and TCR3d 使用TCRmodel和TCR3d建模和可视化T细胞受体
  15. In Silico Cell-Type Deconvolution Methods in Cancer Immunotherapy 癌症免疫疗法中的细胞类型反卷积计算方法
  16. Immundeconv: An R Package for Unified Access to Computational Methods for Estimating Immune Cell Fractions from Bulk RNA-Sequencing Data Immunedeconv:一个R包,用于统一访问从批量RNA测序数据估算免疫细胞比例的计算方法
  17. EPIC: A Tool to Estimate the Proportions of Different Cell Types from Bulk Gene Expression Data EPIC:一个从批量基因表达数据估算不同细胞类型比例的工具
  18. Computational Deconvolution of Tumor-Infiltrating Immune Components with Bulk Tumor Gene Expression Data 使用批量肿瘤基因表达数据计算反卷积肿瘤浸润性免疫组分
  19. Cell-Type Enrichment Analysis of Bulk Transcriptomes Using xCell 使用xCell分析批量转录组的细胞类型富集
  20. Cap Analysis of Gene Expression (CAGE): A Quantitative and Genome-Wide Assay of Transcription Start Sites 基因表达帽分析(CAGE):一个定量的全基因组转录起始位点分析

这些章节涵盖了从体细胞变异发现、HLA分型、新抗原预测、T细胞受体库分析,到免疫细胞类型的反卷积分析等多个方面,为癌症免疫疗法的生物信息学研究提供了全面的理论和实践指导。

难道说偏重于科研技能教学的授课就没意义了吗

大家可能发现了,工业界需要的很多技能更小众,更深入。这就是为什么大家掌握了我们马拉松授课的表达量相关技能,从表达量芯片到转录组测序到单细胞转录组,都只能说是做一下生信科研文章而已。但是这并不能说说偏重于科研技能教学的授课就没意义了,毕竟是千里之行始于足下啊!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
围绕中性粒细胞,生信能做什么
上周我们提到NETs相关的基因集,很多生信文章围绕它们做了预后分析。但NETs毕竟只是中性粒的表型之一,围绕中性粒细胞,还有没有其他东西可做呢?
生信菜鸟团
2025/02/18
1450
围绕中性粒细胞,生信能做什么
单细胞测序技术如何领跑肿瘤的免疫治疗?
歌德曾说过,“一棵树上很难找到两片叶子形状完全一样”,同样的,每一个肿瘤细胞也具有各自的特征。肿瘤是恶性肿瘤细胞、免疫细胞和间质细胞的复杂混合物,通常具有较高程度的瘤内和瘤间异质性。肿瘤微环境(TME)由促肿瘤和抗肿瘤信号组成,能够调节肿瘤生长并影响肿瘤进化。
生信交流平台
2022/09/21
7920
单细胞测序技术如何领跑肿瘤的免疫治疗?
bd平台的单细胞转录组一定能捕获到中性粒细胞吗
既然这个捕获中性粒细胞是BD单细胞转录组的卖点,那么是不是只要是选择了这个技术就一定能能捕获到中性粒细胞呢?让我们随机看看其它比较新的文章,比如同样的2023的《Single-cell and spatial transcriptome analysis reveals the cellular heterogeneity of liver metastatic colorectal cancer》,数据 是 196,473 CD45+ immune cells from 27 samples of six CRC patients, 链接在;https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE225857
生信技能树
2023/11/13
5210
bd平台的单细胞转录组一定能捕获到中性粒细胞吗
生信数据分析可靠与否是一个伪命题
最简单的一个生物信息学数据分析案例,可以是针对一个表达量矩阵以及里面的样品分组进行差异分析,然后拿到统计学显著的上下调基因列表,因为基因数量很多,所以我们默认会做一些生物学功能数据库注释。这里面的生物信息学算法就差异分析和注释算法, 它本身是非常可靠的!
生信技能树
2024/11/21
1120
生信数据分析可靠与否是一个伪命题
可能是作者把部分样品标记错误了分组吗
其中里面的普通转录组数据集链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE243245
生信技能树
2023/11/25
2100
可能是作者把部分样品标记错误了分组吗
爱恨难分—癌症免疫治疗获得性抗性
每个人的时间精力有限,必须优先阅读相关文献,开设这个栏目也是希望为大家推荐高质量的单细胞相关文献。如果大家对单细胞转录组感兴趣可以关注一下,哪怕每天只学一点点,积土成山,积水成渊。
生信技能树jimmy
2020/03/27
1K0
生信爱好者周刊(第 1 期):生信是什么
讨论区的帖子《谁在招人?》[2],提供生信深造和就业信息,欢迎访问或发布学位攻读/工作/实习等岗位。
王诗翔呀
2022/01/21
9630
生信爱好者周刊(第 1 期):生信是什么
癌症免疫研究的技术进步:从免疫基因组学到单细胞分析和人工智能
肿瘤细胞与附近的细胞一起存在于复杂的细胞群落中,这强烈影响肿瘤细胞的生长、行为和与其他细胞的交流。在这些细胞中,免疫细胞是关键的参与者,许多研究证明肿瘤细胞和免疫细胞之间的交流是双向的。事实上,免疫细胞既能促进也能抑制癌变、肿瘤进展、转移和复发。因此,文章主要关注肿瘤免疫微环境(TIME)。
生信技能树jimmy
2022/03/14
1.2K0
癌症免疫研究的技术进步:从免疫基因组学到单细胞分析和人工智能
单细胞时代 || 从众病之王到希望之光
这不是最好的时代,也不是最坏的时代,这里是单细胞时代。灵活的单细胞系统,高效的组织解离液,开源的数据分析工具,端到端的单细胞解决方案是未来发展的趋势。这里最主要的是开放灵活的单细胞系统,有了这个系统我们就可以自主地设计反应体系,来从不同纬度捕获单个细胞的信息。
生信技能树jimmy
2021/03/10
6670
单细胞时代 || 从众病之王到希望之光
生信爱好者周刊(第 54 期):人类和人生的意义
本杂志开源(GitHub: ShixiangWang/weekly[1]),欢迎提交 issue,投稿或推荐生信相关内容。
王诗翔呀
2022/12/30
9190
生信爱好者周刊(第 54 期):人类和人生的意义
生信分析的本手妙手俗手
对于初学者而言,应该从本手开始,本手的功夫扎实了,棋力才会提高。一些初学者热衷于追求妙手,而忽视更为常用的本手。本手是基础,妙手是创造。一般来说,对本手理解深刻,才可能出现妙手;否则,难免下出俗手,水平也不易提升。
生信技能树
2022/07/26
7030
生信分析的本手妙手俗手
医学科研离不开临床医生啊
哪怕是一个生命科学领域的博士生,没有上过临床,对科研的想象也是有限度的,比如大家都知道可以做癌症研究,普通人能想到的实验设计是可以探索癌症的生物学特性、机制、治疗响应以及疾病进展。以下是一些常见的实验设计类型,包括但不限于:
生信技能树
2024/11/21
700
医学科研离不开临床医生啊
生信爱好者周刊(第 128 期):什么事情使你放弃了学术理想?
本杂志开源(GitHub: ShixiangWang/weekly[1]),欢迎提交 issue,投稿或推荐生信相关内容。
生信技能树
2024/07/05
1260
生信爱好者周刊(第 128 期):什么事情使你放弃了学术理想?
不要动不动就花纳税人的钱测序
作为华语界生物信息学领域中文自媒体扛把子的我看起来应该是马上就得炮轰饶毅老师的《为什么批评测序?》观点,因为目前测序基本上就等于生物信息学,所以是我们的生信工程师的生命线。而且这个冲突就是纯粹的代沟,目前主流的30到40岁的生命科学领域从业者基本上是伴随着测序一步步起家的, 跟50到60岁左右的已经功成名就的科学家太不一样了。不知道大家是否还记得《亚当斯科技三定律》:
生信技能树
2024/12/10
1260
不要动不动就花纳税人的钱测序
生信爱好者周刊(第 21 期):科研与爱好
“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF>15)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。第一期于2022年2月正式发布。
王诗翔呀
2022/03/30
4070
生信爱好者周刊(第 21 期):科研与爱好
生信爱好者周刊(第 29 期):Hiplot开发库开源
Hiplot 项目发起于 2019 年,是由国内生物信息学开源社区 Openbiox 和多家单位和机构共同建设的一个免费、易用、部分开源的综合在线绘图系统(生物医学为主)。截至目前,该网站已提供超过 230+余个在线可视化分析功能,涵盖了基础科研绘图、组学可视化和部分临床模型可视化功能。总的注册用户已超过 2 万 5 千人,总访问量超过 300 万次,每日任务数已超 4000 余次。
王诗翔呀
2022/06/27
6180
生信爱好者周刊(第 29 期):Hiplot开发库开源
细胞免疫疗法TCR-T和空间VDJ测序
人类肿瘤抗原主要可分为两类——肿瘤特异性抗原(例如,新抗原和病毒抗原)和肿瘤相关抗原(例如,癌症/睾丸(CT)抗原、过表达抗原和分化抗原)。尽管TCR-T细胞可以靶向所有肿瘤抗原,但迄今为止确定的具有足够安全性和有效性的靶点数量仍然有限。选择合适的TCR-T细胞治疗靶抗原的首要考虑应该是抗原的高特异性。通常选择在肿瘤中高表达但在正常组织中低水平表达的靶抗原来限制任何潜在的脱靶效应和由破坏表达靶抗原的正常组织引起的剂量限制毒性。迄今为止,大多数TCR-T细胞疗法的临床试验都针对CT抗原和病毒抗原,其中纽约食管鳞状细胞癌1(NY-ESO-1)是最常针对的,占迄今为止试验的37%。
追风少年i
2024/02/18
2530
细胞免疫疗法TCR-T和空间VDJ测序
纯粹靠单细胞转录组数据是很难区分CD4和CD8阳性T细胞
我这里就不摘抄代码给大家了,官方文档很详细,https://satijalab.org/seurat/articles/pbmc3k_tutorial.html ,内容很简单而且步骤很清晰:
生信技能树
2023/11/23
2.3K0
纯粹靠单细胞转录组数据是很难区分CD4和CD8阳性T细胞
临床生物信息学工作者需要哪些【硬技能】和【软技能】?
生信菜鸟团
2025/01/02
1710
临床生物信息学工作者需要哪些【硬技能】和【软技能】?
PDX小鼠模型的单细胞样品定量能选择人类参考基因组吗
其中肿瘤病人的多组学数据(肿瘤外显子以及转录组)目前管理很严格,所以是没办法公开获取的,但是文献里面的The single-cell RNA sequencing data of 6 PDX mice 是可以公开的:https://ngdc.cncb.ac.cn/gsa/browse/CRA010501 ,确实是可以看到这个PDX小鼠模型的单细胞样品定量是选择的人类参考基因组:
生信技能树
2024/11/21
1160
PDX小鼠模型的单细胞样品定量能选择人类参考基因组吗
推荐阅读
相关推荐
围绕中性粒细胞,生信能做什么
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验