机器之心整理 作者:蒋思源 近日,ApacheCN 开放了 XGBoost 中文文档项目,该项目提供了 XGBoost 相关的安装步骤、使用教程和调参技巧等中文内容。该项目目前已完成原英文文档 90% 的内容,机器之心简要介绍了该文档并希望各位读者共同完善它。 中文文档地址:http://xgboost.apachecn.org/cn/latest/ 英文文档地址:http://xgboost.apachecn.org/en/latest/ 中文文档 GitHub 地址:https://github.c
XGBoost是一种强大的机器学习算法,但在处理大规模数据时,传统的CPU计算可能会变得缓慢。为了提高性能,XGBoost可以利用GPU进行加速。本教程将介绍如何在Python中使用XGBoost进行GPU加速以及性能优化的方法,并提供相应的代码示例。
XGBoost是一种强大的机器学习算法,但在处理大规模数据时,单节点的计算资源可能不足以满足需求。因此,分布式计算是必不可少的。本教程将介绍如何在Python中使用XGBoost进行分布式计算和大规模数据处理,包括设置分布式环境、使用分布式特征和训练大规模数据集等,并提供相应的代码示例。
本文介绍了如何用XGBoost做时间序列预测,包括将时间序列转化为有监督学习的预测问题,使用前向验证来做模型评估,并给出了可操作的代码示例。
在应用XGBoost模型之前,特征工程和数据预处理是至关重要的步骤。良好的特征工程和数据预处理可以显著提高模型的性能。本教程将介绍在Python中使用XGBoost进行特征工程和数据预处理的中级教程,通过代码示例详细说明各种技术和方法。
环境配置过程是一个很头疼的事情,网上参考资料参差不齐,按照一个教程去执行,总是会出问题,把折腾的过程总结起来,供大家参考。
XGBoost是一种强大的机器学习算法,广泛应用于各种领域的数据建模任务中。但是,在处理时间序列数据时,需要特别注意数据的特点和模型的选择。本教程将深入探讨如何在Python中使用XGBoost建模时间序列数据,包括数据准备、特征工程和模型训练等方面,并提供相应的代码示例。
XGBoost是一种强大的集成学习算法,但在解决复杂问题时,单个模型可能无法达到最佳性能。集成学习和堆叠模型是两种有效的方法,可以进一步提高模型的性能。本教程将深入探讨如何在Python中应用集成学习和堆叠模型,使用代码示例详细说明这些概念。
XGBoost是一种高效的机器学习算法,广泛应用于数据科学和机器学习任务中。本教程将介绍XGBoost的中级用法,重点关注参数调优和模型解释。我们将使用代码示例来说明这些概念,帮助您更好地理解和应用XGBoost。
深度集成与迁移学习是机器学习领域中的两个重要概念,它们可以帮助提高模型的性能和泛化能力。本教程将详细介绍如何在Python中使用XGBoost进行深度集成与迁移学习,包括模型集成、迁移学习的概念和实践等,并提供相应的代码示例。
XGBoost是一种强大的机器学习算法,广泛应用于各种分类任务中。但在处理多分类和不平衡数据时,需要特别注意数据的特点和模型的选择。本教程将深入探讨如何在Python中使用XGBoost处理多分类和不平衡数据,包括数据准备、模型调优和评估等方面,并提供相应的代码示例。
“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”
最近有童鞋在后台询问windows下如何安装xgboost的问题,然后燕哥在团队中一问,哎!还真的有小伙伴会。然后一篇xgboost安装教程就热乎乎地出炉喽~ Windows下x
自动化机器学习(AutoML)是一种通过自动化流程来构建、训练和部署机器学习模型的方法。XGBoost作为一种强大的机器学习算法,也可以用于AutoML。本教程将介绍如何在Python中使用XGBoost进行自动化机器学习,包括数据预处理、特征工程、模型选择和超参数调优等,并提供相应的代码示例。
本文介绍了LightGBM库,它是一个快速、分布式、高性能的梯度提升框架,支持分类和回归任务。LightGBM采用基于决策树的算法,具有高速、高精确度、可扩展性等特点。同时,文章还介绍了如何安装和配置LightGBM,以及如何使用LightGBM进行数据建模和预测。
在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 XGBoost,而且获得非常好的表现,今天就来看看 XGBoost到底是什么以及如何应用。 本文结构: 什么是XGBoost? 为什么要用它? 怎么应用? 学习资源 什么是 XGBoost? XGBoost :eXtreme Gradient Boosting 项目地址:https://github.com/dmlc/xgboost 是由 Tianqi Chen http://homes.cs.washington.edu/~tqc
所有精华资料整理到一篇文章里,以方便大家查阅。 1 neural networks and deep learning 这是一个非常经典的神经网络和深度学习的教程,有完整的免费的电子书,网址: http://neuralnetworksanddeeplearning.com/about.html 2 斯坦福大学,自然语言处理大师 Richard Socher 的课程,怎能不学? 官网的课程介绍: http://web.stanford.edu/class/cs224n http://web.s
教程地址:http://www.showmeai.tech/tutorials/34
在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就来看看 xgboost 到底是什么以及如何应用。 本文结构: 什么是 xgboost? 为什么要用它? 怎么应用? 学习资源 ---- 什么是 xgboost? XGBoost :eXtreme Gradient Boosting 项目地址:https://github.com/dmlc/xgboost 是由 Tianqi Chen http://homes.cs.washington.ed
在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就来看看 xgboost 到底是什么以及如何应用。 本文结构: 什么是 xgboost? 为什么要用它? 怎么应用? 学习资源 什么是 xgboost? XGBoost :eXtreme Gradient Boosting 项目地址:https://github.com/dmlc/xgboost XGBoost是由 Tianqi Chen http://homes.cs.washington.
本文作者Jasperyang,毕业于BUPT。本文原载于知乎专栏,AI 研习社授权转载。 Kaggle 的数据挖掘比赛近年来很火,以至于中国兴起了很多很多类似的比赛,做了两个这种类型的比赛了,Jdata 用户商品购买预测和用户位置精准预测,积累了相当多的比赛经验了,虽然两次成绩都不是特别好,59/4590和 179/2844。 这些比赛的套路从根本上都是一毛一样的,我下面可以和大家探讨一个大致的做题套路以及怎么往高分走的方向,但是总结来说这就是个拼体力的任务,和智力无关。(虽然锻炼了动手能力,极大强化了我在
进阶篇 机器学习算法 本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇,如果你已经学习了该系列的上篇基础篇:从 0 到 1 掌握 Python 机器学习(附资源),那么应该达到了令人
第一步 : 安装git https://git-scm.com/download/win
这是为朋友社群准备的一篇机器学习入门指南,分享了我机器学习之路看过的一些书、教程、视频,还有学习经验和建议,希望能对大家的学习有所帮助。
XGBoost是一种强大的机器学习算法,但训练好的模型要想在实际应用中发挥作用,需要进行部署并实现在线预测功能。本指南将详细介绍如何在Python中部署XGBoost模型,并实现在线预测功能,同时提供相应的代码示例。
在机器学习领域,Boosting是一种强大的集成学习方法,它通过串行训练多个弱学习器(weak learner)并将它们组合成一个强大的模型。本文将详细介绍Boosting的原理、常见算法以及如何在Python中实现。
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
XGBoost是“Extreme Gradient Boosting”的缩写,是一种高效的机器学习算法,用于分类、回归和排序问题。它由陈天奇(Tianqi Chen)在2014年首次提出,并迅速在数据科学竞赛和工业界获得广泛应用。XGBoost基于梯度提升框架,但通过引入一系列优化来提升性能和效率。
Machine Learning Mastery 机器学习算法教程 机器学习算法之旅 利用隔离森林和核密度估计的异常检测 机器学习中的装袋和随机森林集成算法 从零开始实现机器学习算法的好处 更好的朴素贝叶斯:从朴素贝叶斯算法中收益最大的 12 个技巧 机器学习的提升和 AdaBoost 选择机器学习算法:Microsoft Azure 的经验教训 机器学习的分类和回归树 什么是机器学习中的混淆矩阵 如何使用 Python 从零开始创建算法测试工具 通过创建机器学习算法的目标列表来获得控制权 机器学习中算法
Kaggle 的数据挖掘比赛近年来很火,以至于中国兴起了很多很多类似的比赛,做了两个这种类型的比赛了,Jdata 用户商品购买预测和用户位置精准预测,积累了相当多的比赛经验了,虽然两次成绩都不是特别好,59/4590和 179/2844。 这些比赛的套路从根本上都是一毛一样的,我下面可以和大家探讨一个大致的做题套路以及怎么往高分走的方向,但是总结来说这就是个拼体力的任务,和智力无关。(虽然锻炼了动手能力,极大强化了我在 sklearn 和 pandas 上的技能熟练度...) PART 1 : 怎么开始
XGBoost是一个开放源码库,提供了梯度增强决策树的高性能实现。一个底层的C++代码库和一个Python接口组合在一起,形成了一个非常强大但易于实现的软件包。
教程地址:http://www.showmeai.tech/tutorials/41
特征重要性评分是一种为输入特征评分的手段,其依据是输入特征在预测目标变量过程中的有用程度。
参与方式:https://github.com/apachecn/stanford-cs224n-notes-zh/blob/master/CONTRIBUTING.md
01 基 础 篇 01 基本Python 如果我们打算利用 Python 来执行机器学习,那么对 Python 有一些基本的了解就是至关重要的。幸运的是,因为 Python 是一种得到了广泛使用的通用编程语言,加上其在科学计算和机器学习领域的应用,所以找到一个初学者教程并不十分困难。你在 Python 和编程上的经验水平对于起步而言是至关重要的。 首先,你需要安装 Python。因为我们后面会用到科学计算和机器学习软件包,所以我建议你安装 Anaconda。这是一个可用于 Linux、OS X 和 Wind
导语:Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:http://suo.im/KUWgl 和 http://suo.im/96wD3。本教程的作者为 KDnuggets 副主编兼数据科学家 Matthew Mayo。另
选自kdnuggets 作者:Matthew Mayo 机器之心编译 参与:黄小天、吴攀、晏奇、蒋思源 Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:http://suo.im/KUWgl 和 http://suo.im
来源:机器之心 作者:Matthew Mayo 校对:丁楠雅 编辑:胡蝶 原文可参阅:http://suo.im/KUWgl 和 http://suo.im/96wD3 本文字数为7433,建议阅读15分钟 本文帮助大家从 0 到 1 掌握 Python 机器学习 「开始」往往是最难的,尤其是当选择太多的时候,一个人往往很难下定决定做出选择。本教程的目的是帮助几乎没有 Python 机器学习背景的新手成长为知识渊博的实践者,而且这个过程中仅需要使用免费的材料和资源即可。这个大纲的主要目标是带你了解那些数
分享一篇来自机器之心的文章。关于机器学习的起步,讲的还是很清楚的。原文链接在:只需十四步:从零开始掌握Python机器学习(附资源) Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:suo.im/KUWgl 和 su
导语:Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。另外,小编在这里邀请大家加入到我们,小编Tom邀请你一起搞事情! 「开始」往往是最难的,尤其是当选择太多的时候,一个人往往很难下定决定做出选择。本教程的目的是帮助几乎没有 Python 机器学习背景的新手成长为知识渊博的实践者,而且这个
在2018年初,互联网领域发现了两大系统漏洞,影响了主要的处理器厂商,这两大漏洞分别是“Meltdown(熔断)”和“Spectre(幽灵)”。这些漏洞是处理器前瞻执行的的漏洞,它允许攻击者读取其各自进程之外(以及潜在的执行)的内存位置,这意味着程序可以在其他软件的内存中读取敏感数据。 为了修复漏洞,Linux内核合并了一个名为KAISER或PTI(页表隔离page table isolation)的补丁,有效地修复了Meltdown攻击。然而,这一补丁会导致性能下降,CPU性能下降了5%到35%(甚至有一
参与方式:https://github.com/apachecn/interpretable-ml-book-zh/blob/master/CONTRIBUTING.md
在XGBoost 1.0.0中,引入了对使用JSON保存/加载XGBoost模型和相关超参数的支持,旨在用一个可以轻松重用的开放格式取代旧的二进制内部格式。后来在XGBoost 1.6.0中,还添加了对通用二进制JSON的额外支持,作为更高效的模型IO的优化。它们具有相同的文档结构,但具有不同的表示形式,但都统称为JSON格式。本教程旨在分享一些关于XGBoost中使用的JSON序列化方法的基本见解。除非明确说明,以下各节假定正在使用2个输出格式之一,可以通过在保存/加载模型时提供带有.json(或二进制JSON的.ubj)文件扩展名的文件名来启用这两种格式:booster.save_model('model.json')。
想提高机器学习实验的效率,把更多精力放在解决业务问题而不是写代码上?低代码平台或许是个不错的选择。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
GeeksForGeeks 是计算机科学百科,涵盖了所有计算机科学核心课程。 本项目的目标是翻译 GeeksForGeeks 站点内的一部分教程。 这些教程适用于: APCS 本科专业课 研究生考试 计算机三、四级 不适用于: ACM/OI CTF 大数据竞赛 高中信息技术 软考 由于工作量非常大,我们不得不使用谷歌翻译来辅助。 目前已上传的章节有: 数据库 计算理论 编译 数字逻辑 组成原理 操作系统 计算机网络 贡献指南 这些教程需要校对,我们日后可能会组织校对活动。 欢迎任何人参与和完善:一个
由于最近几周工作紧以及该文涉及机器学习,翻译有点水的厉害。推荐不要在这浪费时间还是直接看英文原文的好。
领取专属 10元无门槛券
手把手带您无忧上云