决策树是最接近人类思考模式的一种机器学习算法,也是最容易理解的,也是应用最广泛的,值得一谈。
临床诊断过程的思维模式,是一个逐步决策的过程,实质上也是一个根据输入条件,进行分类的过程。输入条件包括各种临床表现、检查结果,输出的则是诊断和下一步处理意见,例如手术、还是保守治疗。
决策树算法事实上也是在解决分类问题,机器学习当中,首先需要对已经有结论的数据进行学习,学习的结果就长成了一棵"决策树"。决策的起点是"根节点",根据条件进行逐层分类,逐步形成了"决策节点","分支"和最终的"叶节点"。
机器采取的方法大致是"分而治之",第一种是"Divide and Conquer",第二种是"Separate and Conquer",区别是划分样本和建立规则的方式不同。但结果都是形成可读规则构成的树状决策流程。
根据数据复杂程度和算法参数设置不同,树可以变得非常复杂。算法的一个重要步骤是"修剪",即根据对准确性、敏感度和特异度的要求进行调整。很大程度上要保证准确率、敏感度和特异度的平衡。
在临床上,决策树非常适用于建立临床路径一类的规则,目前的路径建立基本上都以专家共识为主建立。如果通过机器学习,利用决策树算法不断优化和总结,无论是改进现有路径,还是辅助医生实施路径,都有较大的空间,最大程度上降低漏诊和误诊的概率。例如,在急腹症的诊断中,因忘记除外宫外孕造成漏诊的案例并不少见,而利用计算机辅助决策则很容易避免。机器学习大量数据可能发现人类可能忽视的规则组合,例如某项血液、检查指标和阑尾炎的关系等等。
在决策树的基础上,结合其他算法,可能会形成"回归决策树","贝叶斯决策树","随机森林"(随机产生多棵决策树再组合选择)等其他算法。
决策树算法,在算法分类中,属于『贪心算法』(Greedy Algorithm),即分步骤进行,每一步都是在获取局部最优解,并不能保证最终整体的最优。这又何尝不是人类思维的一个局限。
注:图片来自网络
领取专属 10元无门槛券
私享最新 技术干货