首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

PNAS:过去二十年心理学论文的可重复性调查

由于社会科学中的可复制性较弱,学者们渴望量化一门学科的不可复制性的规模和范围。然而,小规模手动复制方法不适合处理这个大数据问题。在这里,我们在科学领域进行了一个全学科范围内的复制普查。包含样本(N=14,126篇论文)几乎涵盖了过去20年里在6家顶级心理学期刊上发表的几乎所有论文。使用一个经过验证的机器学习模型,估计论文的复制可能性,最终结果既支持又反驳了之前相对较小的人工复制样本中所得出的推测。首先,我们发现心理学的单一整体复制率不能很好地捕捉到子域之间不同程度的可复制性。其次,我们发现在所有子领域中,复制率与研究方法密切相关。实验的重复速率明显低于非实验研究。第三,我们发现作者的累积发表数量和被引文的影响与复制的可能性呈正相关,而对研究质量和严谨性的其他相关因素,如作者的大学声望和论文的被引文,与可复制性无关。最后,我们发现媒体关注与复制失败的可能性呈正相关。我们对可复制性的规模和范围的评估是广泛解决可复制性问题的重要下一步。

03

特征工程(一):前向逐步回归(R语言)

“ 建模过程中,选择合适的特征集合,可以帮助控制模型复杂度,防止过拟合等问题。为了选取最佳的特征集合,可以遍历所有的列组合,找出效果最佳的集合,但这样需要大量的计算。本文介绍的前向逐步回归法是针对最小二乘法的修改。相对于要将所有组合情况遍历一遍,前向逐步回归可以大大节省计算量,选择最优的特征集合,从而解决过拟合问题。” 前向逐步回归 前向逐步回归的过程是:遍历属性的一列子集,选择使模型效果最好的那一列属性。接着寻找与其组合效果最好的第二列属性,而不是遍历所有的两列子集。以此类推,每次遍历时,子集都包含上一次

011
领券