LightGBM 使用指南

在线学习中心课程LightGBM 使用指南

20分钟

并行学习

lightgbm 已经提供了以下并行学习算法： 并行算法开启方式数据并行tree_learner='data'特征并行tree_learner='feature'投票并行tree_learner='voting'tree_learner 默认为 'serial'。表示串行学习。这些并行算法适用于不同场景： 样本数量较小样本数量巨大特征数量较小特征并行数据并行特征数量巨大特征并行投票并行
构建并行版本：默认的并行版本基于socket 的并行学习，如果需要基于MPI 的并行版本，则需要手动编译
- 首先收集所有想要运行并行学习的机器的IP，并指定一个TCP 端口号（要求在这些机器上，这些端口没有被防火墙屏蔽掉）。然后将这些IP 和端口写入到文件中（假设文件名为ip.txt ）： ip1 portip2 port 其中要求：
  - 数量必须和num_machines 或者num_machine 参数相等
  - 必须包含127.0.0.1 （或者包含localhost 对应的其它ip)，它代表本地
  - port 必须和local_listen_port 或者local_port 参数相等
- 然后在配置文件中编译以下参数： tree_learner= 你的并行算法num_machines= 并行计算的机器的数量machine_list_file=ip.txt #要求每个并行计算的机器占一行local_listen_port=port
- 然后将数据文件、可执行文件、配置文件、以及ip.txt 拷贝到所有并行学习的机器上。
- 在所有机器上运行以下命令：
  - windows： lightgbm.exe config=配置文件
  - Linux: ./lightgbm config=配置文件

3. 并行学习的注意事项：

当前Python 版本不支持并行，必须采用lightgbm 二进制的方式。
在执行推断时，要求数据的特征与训练时的特征完全一致
- 必须都包含label 列。推断时，该列的数值不起作用，仅仅是个占位符。
- 如果有 header，则列的先后顺序不重要。如果没有header，则必须顺序也要保持相同。

上一节: LambdaRank 下一节: 数据接口

直播支持申请

职业发展学习路径

热门技术学习路径

搜索热词

目录

评价

推荐

1. 安装

安装步骤：

直接pip 安装：

2. 调参

调参指导

参数

核心参数

学习控制参数

IO 参数

目标函数的参数

度量参数

网络参数

GPU 参数

模型参数

3. 进阶

缺失值处理

分类特征支持

LambdaRank

并行学习

4. API

数据接口

Dataset

方法：

步骤三：

示例：

模型接口

模型接口

模型接口

直接学习

直接学习

scikit-learn API

scikit-learn API

LGBMClassifier

LGBMRegressor

LGBMRanker

Callbacks

绘图API

Booster API 转换

5. Docker

安装和使用

python 模式：

腾讯产业互联网学堂

课程评价 (0)

学员评价

相关云产品

云服务器

GPU 云服务器

FPGA 云服务器_FPGA 实例_硬件加速

相关课程推荐

并行学习