医生说:
XGBoost中使用的数据矩阵。DMatrix是XGBoost使用的一种内部数据结构,它对内存效率和训练速度都进行了优化。您可以从多个不同的数据源构造DMatrix。
我知道这一点,但是与Pandas相比,DMatrix的使用有什么区别呢?
发布于 2021-11-29 21:48:13
在使用XGBoost Python包时,您可以选择两个不同的API来训练您的模型。XGB自己的学习API和Scikit-学习API。
当使用Scikit-Learn时,数据作为numpy数组或熊猫数据传递给模型。当使用学习API数据时,使用DMatrix传递数据。
查看一下python示例,查看使用了这两种API。
基本上,您已经在DMatrix中找到了“使用文档而不是Pandas”:它是XGBoost开发人员为“内存效率和培训速度”与机器学习库一起创建的数据结构。
https://stackoverflow.com/questions/70127049
复制相似问题