对于以往研究的总结是帮助我们了解之前的研究情况,结果以及寻找新的研究方向不可或缺的一步。由于这种总结的必要性,所以也诞生了很多基于不同类型的文章。所以今天就基于论著的不同部分,来简单介绍这些对之前研究结果进行总结分析的文章。
在了解都有哪些文章形式之前,需要先了解一篇文章主要包括哪些内容。摘要属于文章内容的精简。所以从摘要部分也就能看到文章包括的内容。在👇 的摘要中可以看到,一个文章主要包括:前言、材料方法、结果和结论。
除了以上这些文章内的内容。每个文章还会包括一些基本的信息,比如文章的作者、发表年份、单位、杂志、参考文献、关键词等等。我们可以把这些基本信息称为文章的元数据。
某种意义上而言,每个文章都包括的内容都属于元数据,所以文章的摘要也可以算作文章元数据
综上,可以看出,一篇论著主要包括==元数据、前言、材料方法、结果、结论==这五个部分。在五个部分当中,前言属于对之前研究的简单总结一般没有什么实质性内容。除开前言,其他各个部分都可以通过总结来进行二次分析,基于不同部分的分析,都有一个专业性的名称。具体关系如下。
「文献计量学」本质上是对文章的元数据进行文本挖掘。所以一些基本的数据挖掘技巧都可以在「文献计量学」当中使用,比如:
文章搜索方面:「文献计量学」的题目一般都包括Bibliometric这个关键词。在Pubmed检索的时候使用这个关键词➕ 想要查看的领域即可。比如:Bibliometric + Gastric cancer
文献计量学的主要流程基本就是下载文献信息——数据分析。目前有很多一站式的文献计量学分析工具。比如:VOSviewer - Visualizing scientific landscapes: https://www.vosviewer.com/ 以及文献计量在线分析平台: https://bibliometric.com/ 。如果会用R语言分析的话,bibliometrix 包也是一个不错的选择。
一般流程: 1. 确定研究方向主题词; 2. 基于主题词检测相关文献元数据并下载; 3. 将数据导入具体工具进行分析。
随着技术的进步,经常会有多种不同的方法来达到相同的目的。比如做蛋白检测的时候,可以使用western blot也可以使用免疫组化。做预后分析的时候,可以使用Kaplan-Meier也可以使用Cox回归等算法。为了让其他人在做实验/分析的时候选择合适的方法,所以也就有了方法评测类 (benchmark) 的文章。
我们之前介绍的[[预后分析那个算法更好]]、[[免疫算法原理]]以及[[多组学降维分析算法哪个更好]]都属于这类的文章。类似的我们之前也做过的关于蛋白相互作用数据库的评测:[[相互作用数据库比较]]
文章搜索:这类的文章没有「文献计量学」方面特征性明显。不过大多数文献都会包括:benchmark这个关键词,但是也不绝对。另外关于benchmark 有关的文章一部分剂量有关的评测。
一般流程: 1. 收集某一方向的相关方法/算法; 2. 了解这些方法/算法的基本原理; 3. 将多个方法在同一个数据上进行检测,评价多个方法的优劣。
基于文章结果通量的高低可以把结果分成结果分成高通量和低通量的。高通量结果是指利用技术一次性检测很多数据的结果,比如,[[RNA-seq相关内容介绍]]或者[[chip-seq是个什么东东]]。而低通量的结果则是具体的实验结果,比如某一个研究检测了TP53蛋白表达和胃癌的关系。
由于高通量的数据包括了很大的数据量(比如RNA-seq一次性可以检测上万的基因表达),而一篇文章由于研究方向的限制,可能只用了测序一部分的结果。比如,作者做了癌和癌旁样本的高通量测序的主要目的是找到一个和癌症有关的基因进而进行下游基础实验,但对癌和癌旁样本所有差异基因的综合性作用并没有进行详细的分析。因此如果是以探索分析癌症整体发病机制为目的的话,就可以进行重新分析。
这样利用以往作者发表的高通量测序的数据进行重新分析的方式,也就是所谓的「公共测序数据挖掘」。目前随着高通量测序数据分析门槛的降低,公共测序数据重分析也算是一个绕不开的热点。我们之前介绍的[[0.最最最基础生信分析总结]]也算是一种入门级别的高通量数据分析教程,有兴趣的可以了解一下。
近十年公共测序数据挖掘文章趋势
文章检索:测序数据重分析的文章一般来说没有特别的关键词可以进行检索。不过可以基于常用的测序数据库来进行检索,比如检索GEO/TCGA + 想要研究的方向即可。
免疫浸润方面发表的公共测序重分析文章
一般流程: 1. 确定自己的研究方向; 2. 寻找符合自己标准的测序数据。目前比较大的公共测序数据库是:[[GEO数据库]]。如果是肿瘤研究的话,使用最多的还是[[TCGA、ICGC、GTEx-数据库都是啥?#TCGA]]; 3. 基于自己的目的分析数据。
和高通量的结果不同,低通量结果比较单一。但是对于某一个相同的研究方向其研究结果可能受到人种,疾病,样本量等因素影响,导致研究结果可能不同。比如研究TP53基因表达对肿瘤的影响,可能在胃癌和肺癌当中的结果是不同的,同样在胃癌当中,500人的研究和50人的研究结果可能是不同的。为了更好明确TP53对于肿瘤的影响,就需要把之前发表的文章结果放到一起进行整合性分析。
这样把之前的结果汇总到一起分析的方法叫做「Meta分析」。对于一个研究方向,只要相似研究结果到了一定的程度,都可以考虑进行Meta分析来重新观察结果的。
文章检索:Meta分析类的文章一般在题目当中也会写到Meta-analysis。一般很好识别。
一般流程: 1. 确定自己的研究主题词; 2. 基于主题词检索相关文献; 3. 提取符合标准的文献当中的结果; 4. 基于文献的结果进行分析。
如果一个研究方向比较成熟之后,综合以往的研究结论来对这个领域进行总结。这样的东西就属于传统的综述了。综述主要是通过文字来对这个领域进行描述。在综述当中主要会描述这个领域之前的研究进展以及未来的研究方向。类似于一篇自我的年终总结。
我们之前介绍的[[3'UTR是干嘛的?]]就是对3'UTR的功能的一个综述,以及[[eccDNA基本内容]]则是对eccDNA目前研究情况的总结。
文章检索:综述类的文章,都有一个特殊的标识:review。而且在很多检索数据库当中都可以进行综述文章的筛选。所以检索的时候检索关键词,筛选综述即可。
一般流程: 1. 确定研究方向主题词 2. 检索相关文献 3. 阅读文献 4. 书写文章
以上是对五个不同的文献形式进行了简单的介绍。由于以上五种都是通过收集以前的文章数据来进行分析。所以彼此之间也存在一些相似性,所以就说一下能想到的几种文章的联系和区别。
以上就是能想到的几点比较。如有遗漏,欢迎后台补充。