今天我们翻译一篇文章,原文 2023年8月发表在《Nature Biotechnology》。本文讨论当前生物信息学教育和培训面临的一些巨大挑战,希望生物信息教学和学习者都能有所借鉴,思考。
随着生命科学领域对生物信息学专门知识的需求日益增加,需要作出协调一致的努力,积极主动地批判性地思考教育和培训具有必要技能和能力的生命科学家的挑战。
生命和健康科学界正面临着管理发现过程的重大挑战,这一过程正变得越来越量化和数据驱动。应对这一挑战的关键是生物信息学——它可以被定义为从大量生物数据和信息中收集、管理、分析、建模和生成预测的科学。生物信息学是一个高度跨学科的领域,涉及许多专业知识,包括生命与健康科学、数据科学、计算机科学、人工智能(AI)、数学和统计学。生命科学领域迫切需要生物信息学专业知识。随着生命科学研究越来越依赖于复杂和抽象的计算工具,如机器学习和人工智能,该领域的人员需要对它们的适当使用和解释有一个基本的了解,这一点怎么强调都不为过。然而,在生物信息学基础方面教育和培训生命科学家的进展却极其缓慢。尽管近几十年来生物数据的生产急剧增长,但对高等教育机构生命科学课程的粗略审查显示进展不大,在向生命科学毕业生灌输必要的生物信息学技能和能力方面还有很多工作要做。
独立地,一些生物信息学研究人员和组织(表 1)已经采取措施,在从地方到全球各个层面的生物信息学教育和培训面临巨大挑战。然而,鉴于全球需求的严重性和紧迫性,需要更多的协调努力。因此,我们主动扩大和补充现有的努力,创建了生物信息学大挑战联盟 (BGCC; https://www.apbionet.org/bgcc) 促进机构和组织(包括表 1 中提到的机构和组织)之间的国际合作,积极和批判性地反思未来的广泛挑战。首先,BGCC 旨在确定生物信息学教育和培训方面的重大挑战,其最终目标不仅是提高所有相关利益攸关方的认识,而且还呼吁采取行动,共同寻找和制定解决方案。
大挑战一般可以定义为难以解决的复杂问题,不能通过投入更多的资金、时间、劳动力和/或资源来轻易解决。这是全球范围内难以解决的进步道路上的重大障碍。然而,它提供了通过广泛的集体努力,跨许多技术和非技术学科的协调和协作,以及随着时间的推移开发良好定义的度量标准最终可处理的希望。
其他领域已经定义了重大挑战列表,作为研究人员优先解决最紧迫问题的一种方式。Stephan 等人提供了一个大挑战的历史,尽管主要是从数学的角度出发,并提供了对其定义的一般考虑,这适用于其他学科。因此,不同学科的重大挑战有着相似的总体目标。《科学》杂志 2013 年的一期特刊聚焦于科学教育和培训中的重大挑战。尽管在这些挑战中取得了进展,但生物信息学作为一个跨学科领域,对整个生命科学研究界提出了一系列独特的重大挑战。
生物信息学教育和培训面临着特别的困难,因为它跨越多个科学和学术领域,许多教员本身可能没有受过正式教育和培训。与此同时,随着对整个生命科学中生物数据的全面和严格分析的需求增加,对强大的生物信息学教育的需求继续增长。然而,截至 2014 年,全球只有大约 25%的生命科学教育项目教授生物信息学。此外,生物信息学教育和培训并不止步于正规教育路线的终点。这个领域发展如此之快,无论是生物信息学家还是其他生命科学家,研究人员和教育工作者都有必要在他们的职业生涯中不断提高自己的技能(适应科学进步的终身学习)。在这里,我们讨论了生物信息学教育和培训中的重大挑战,以帮助我们理解为什么许多机构仍然在努力满足更广泛的社区的培训需求,并提高对需要改变以克服这些障碍的认识。
我们组建了一个由经验丰富的教育工作者和培训师组成的工作组,通过他们在致力于生物信息学教育和培训的国际和区域组织的成员资格和参与来招募他们(表 1),以确定一系列重大挑战的共识。工作组的任务是回答以下问题:“未来 10 -20 年,生物信息学教育者和培训师将面临哪些重大挑战?”然后审查 19 个初步大挑战的结果清单,以消除冗余并将挑战分组为主要主题。在几次工作会议上,每个挑战都被讨论和完善,直到七个大挑战达成共识。被消除的挑战包括一些被认为过于具体的挑战(例如,“为量子计算生物信息学做准备”);那些可以用更多的时间、精力或财政资源来解决的问题(例如,“现有和新兴生物信息学工具的可用性、维护和集成”);或者那些被认为不够重要而被贴上“重大挑战”标签的挑战(例如,“培训师应该熟练地应对社交媒体一代”)。在这里,我们提出了工作组确定和定义的七大挑战。我们不为这些挑战提供解决方案,而只是识别它们,在社区内发起行动,激发辩论和讨论,以找到必要的解决方案。
事实证明,就一系列重大挑战达成共识本身就很困难。生物信息学是一个广泛而迅速发展的领域,很难做到全面。工作组还花了相当多的时间区分和界定长期而言具有相关性和共鸣性的挑战与可以通过更多资源、资金和(或)时间来解决的较直接的挑战。面对非常不同的国家和体制背景的国际教育界所产生的广泛观点也使确定共同主题变得困难。生物信息学教育者本身来自不同的学科背景,再次导致一系列的观点,需要综合成一个共同的愿景。
从广义上讲,这里定义的大挑战(GC)可以分为影响学习者的挑战(GC1 和 GC2),影响教育者和培训者的挑战(GC3 和 GC4),以及对长期加强生物信息学教育至关重要的挑战(GC5、GC6 和 GC7)。其中一些重大挑战是长期存在的,而另一些则是随着科学技术在其社会和经济背景下的发展而出现的。
一个主要的重大挑战是确定基本的数学,统计,计算,生物和任何其他知识和技能的生物信息学学习者需要在早期阶段准备工作在一个选择的职业。从广义上讲,这包括识别需要生物信息学教育和培训的不同角色(个人类型),定义满足和覆盖其需求的核心能力,并为培训师和学员提供教授(培训师)或获得(学员)这些核心能力所需的资源和机会。
除了核心基本技能之外,生物信息学从业人员必须不断拓宽视野,跟上生物知识和生物数据以及用于研究这些知识和数据的技术、计算、数学和统计方法的进步步伐。最大的挑战是提供生物信息学培训,这为终身学习提供了机会,其中它涵盖了不断增加的子学科数量和范围,并且还根据个人学习者在各自职业阶段的培训需求量身定制。
提供高质量的生物信息学教育和培训需要训练有素和技术熟练的教育工作者。生物信息学在这方面面临着特殊的困难,因为它是一个相对年轻的跨学科领域。其中教育工作者本身可能没有接受过生物信息学方面的正式培训,但仍然必须跟上经常借鉴其他学科的新进展。巨大的挑战是确保具有任何特定基本技能(GC 1)或终身学习(GC 2)的教育工作者充分掌握核心教学技能;展示最新的内容知识;并有意识、机会和机构支持,以获得有效教授该主题所需的实践专业知识。
计算和生物技术平台不断发展,改变了从业者必须使用的计算能力、概念范式和数据大小。这不仅仅是学习新技术的问题,但通常是学习全新的理论框架,需要使用完全不同规模的数据或基于全新原理的技术。这就需要对从业人员进行培训,使其掌握充分利用新技术和能力所需的技能。除了确保基本技能(GC1)不断发展以纳入这些新技术和确保培训人员自己跟上步伐(GC3)之外,教育工作者还必须预测潜在的新技术对培训方式的影响,并相应地调整培训。
随着生物信息学应用和实践的发展,新的伦理、法律和社会影响(ELSI)出现,给研究人员和用户带来了进一步的挑战。虽然长期以来一直在生物医学和生命科学研究中研究数据隐私和侵犯人权问题,但在数据的使用和共享方面,需要提高对 ELSI 的认识。这包括从确保数据公平性(可查找性、可访问性、互操作性和可重用性)到进一步开发和实施基于人工智能的方法所带来的挑战,以及对生物信息学技术和大规模计算对环境影响的日益认识。生物信息学教育面临的巨大挑战是,教育工作者需要熟悉 ELSI,并能够突出研究人员、开发人员和用户面临的挑战,使他们能够发展道德探究和推理方面的技能,并将这些技能应用于实践。
不同国家、地区和社区在生物信息学专业知识和相关教学和研究资源的可得性方面存在很大差异,这使得一些区域很难达到与其他区域相同的培训水平。最大的挑战是减少这些差异- -例如,通过培养当地的专门知识和资源,并开发一套可携带的培训材料和资源,以便在国际上可以获得和使用,尽管语言、资源或管理结构等存在地方局部差异。
识别、获取和维护生物信息学教育资源变得越来越困难。为越来越多和越来越广泛的受众开发有意义的、可获得的、具有成本效益的生物信息学培训机会所需的资金、人才、时间和其他资源存在限制,而且经常与机构的优先事项不匹配。最大的挑战是开发一种可持续的模式,在这种模式下,尽管学员群体的需求和期望不断变化,但资源(如培训材料库)可以开发、共享、维护和更新(或在必要时退出)。
我们强调生物信息学教育和培训中的这些重大挑战,因为它们很难解决,但迫切需要解决方案。确定和界定这些问题的目的是呼吁更广泛的社会采取行动,参与和支持制定解决方案。有一个国际生物信息学教育社区通过汇集社区的努力和专业知识来实现这一目标,如年度生物信息学教育峰会,GOBLET 年度大会,年度国际生物信息学会议(InCoB)的 APBioNET 教育轨道,SoIBio 在拉丁美洲推动的研讨会和合作行动,特别关注的教育社区跟踪分子生物学智能系统(ISMB)会议,以及许多其他全球活动。这些集体努力正在制定指导方针和资源,以支持生物信息学教育工作者和培训人员制定有效的课程,训练培训人员,并扩大生物信息学培训的全球范围。教育界在未来几年进行回顾时,必须审查在应对重大挑战方面取得的进展。然而,巨大的挑战是生物信息学教育界无法单独解决的问题。我们希望,呼吁关注这些问题将是动员所有利益攸关方,特别是更广泛的生命科学界的一个步骤。教育工作者、从业者、专业协会、资助和监管机构都需要共同努力,解决这些持续存在的问题,以促进整个生物学和医学的进步。
一键分析10X单细胞数据(点击图片跳转)
一键分析Bulk转录组数据(点击图片跳转)