Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >强烈安利这款功能强悍的机器学习可视化工具

强烈安利这款功能强悍的机器学习可视化工具

作者头像
Ai学习的老章
发布于 2019-09-17 06:58:05
发布于 2019-09-17 06:58:05
93000
代码可运行
举报
运行总次数:0
代码可运行

Yellowbrick是由一套被称为"Visualizers"组成的可视化诊断工具组成的套餐,其由Scikit-Learn API延伸而来,对模型选择过程其指导作用。总之,Yellowbrick结合了Scikit-Learn和Matplotlib并且最好得传承了Scikit-Learn文档,对你的模型进行可视化! Juan L. Kehoe

Yellowbrick主要包含的组件如下:

特征可视化

Rank Features: 对单个或者两两对应的特征进行排序以检测其相关性

Parallel Coordinates: 对实例进行水平视图

Radial Visualization: 在一个圆形视图中将实例分隔开

PCA Projection: 通过主成分将实例投射

Feature Importances: 基于它们在模型中的表现对特征进行排序

Scatter and Joint Plots: 用选择的特征对其进行可视化

分类可视化

Class Balance: 看类的分布怎样影响模型

Classification Report: 用视图的方式呈现精确率,召回率和F1值

ROC/AUC Curves: 特征曲线和ROC曲线子下的面积

Confusion Matrices: 对分类决定进行视图描述

回归可视化

Prediction Error Plot: 沿着目标区域对模型进行细分

Residuals Plot: 显示训练数据和测试数据中残差的差异

Alpha Selection: 显示不同alpha值选择对正则化的影响

聚类可视化

K-Elbow Plot: 用肘部法则或者其他指标选择k值

Silhouette Plot: 通过对轮廓系数值进行视图来选择k值

文本可视化

Term Frequency: 对词项在语料库中的分布频率进行可视化

t-SNE Corpus Visualization: 用随机邻域嵌入来投射文档

Yellowbrick仅能运行于python3.4以上版本,安装十分简单。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ pip install yellowbrick

使用方法也很简单,以特征选择为例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from sklearn.linear_model import Lasso
from yellowbrick.datasets import load_concrete
from yellowbrick.model_selection import FeatureImportances

# Load the regression dataset
dataset = load_concrete(return_dataset=True)
X, y = dataset.to_data()

# Title case the feature for better display and create the visualizer
labels = list(map(lambda s: s.title(), dataset.meta['features']))
viz = FeatureImportances(Lasso(), labels=labels, relative=False)

# Fit and show the feature importances
viz.fit(X, y)
viz.poof()

感兴趣的同学赶紧尝试一下吧。

https://www.scikit-yb.org

英语不好的同学也不用担心,已经有热心小伙伴正在将文档翻译成中文

http://www.scikit-yb.org/zh/latest/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
这5个机器学习项目你不可错过!(附代码)
本文共2299字,建议阅读6分钟。 本文将给大家介绍五个十分可怕但还鲜为人知的机器学习项目,囊括了一些潜在的机器学习的新想法。
数据派THU
2018/07/30
4380
这5个机器学习项目你不可错过!(附代码)
资源 | 可视化工具Yellowbrick:超参与行为的可视化带来更优秀的实现
机器之心编译 参与:思源、刘晓坤 Yellowbrick 是一套名为「Visualizers」的视觉诊断工具,它扩展了 Scikit-Learn API 以允许我们监督模型的选择过程。简而言之,Yel
机器之心
2018/06/12
8200
数据探索很麻烦?推荐一款史上最强大的特征分析可视化工具:yellowbrick
玩过建模的朋友都知道,在建立模型之前有很长的一段特征工程工作要做,而在特征工程的过程中,探索性数据分析又是必不可少的一部分,因为如果我们要对各个特征进行细致的分析,那么必然会进行一些可视化以辅助我们来做选择和判断。
Python数据科学
2019/08/15
1.5K0
SHAP 机器学习模型解释可视化工具
SHAP 是机器学习模型解释可视化工具。在此示例中,使用 SHAP 计算使用 Python 和 scikit-learn 的神经网络的特征影响 。对于这个例子,使用 scikit-learn 的 糖尿病数据集,它是一个回归数据集。首先安装shap库。
润森
2022/09/22
2.9K0
SHAP 机器学习模型解释可视化工具
【机器学习】关于机器学习模型可解释(XAI),再分享一招!
随着时间的推移,学习模型变得越来越复杂,很难直观地分析它们。人们经常听说机器学习模型是"黑匣子",从某种意义上说,它们可以做出很好的预测,但我们无法理解这些预测背后的逻辑。这种说法是正确的,因为大多数数据科学家发现很难从模型中提取见解。然而,我们可以使用一些工具从复杂的机器学习模型中提取见解。
黄博的机器学习圈子
2021/07/07
4020
【机器学习】关于机器学习模型可解释(XAI),再分享一招!
你不应该忽略的五个机器学习项目一览
随着人工智能和深度学习的兴起,网络上存在的学习资源以及开源项目也越来越多。本文精选了的五个项目,都含有潜在新的机器学习想法,且全都是用Python实现。下面简单介绍 下这五个项目,感兴趣的可以自己上手复现一下,说不定会对自己的项目产生一些新的想法。
用户3578099
2019/08/16
5590
从入门到精通Python机器学习:scikit-learn实战指南
在数据科学和机器学习领域,Python以其简洁的语法和强大的库支持,成为了许多开发者和研究者的首选语言。而在众多Python机器学习库中,scikit-learn以其易用性、灵活性和强大的算法集合,成为了最受欢迎的库之一。本文将深入探讨scikit-learn的原理和应用,并通过项目案例展示其在实际问题解决中的强大能力。
颜淡慕潇
2024/07/17
1.3K0
从入门到精通Python机器学习:scikit-learn实战指南
机器学习和 AI 领域必须了解的工具
关于数据科学,工具可能并不是那么热门的话题。人们似乎更关注最新的聊天机器人技术以及深度学习框架。 但这显然是不合理的。为什么不花些时间,挑选合适的工具呢?毕竟好的工具能够让你事半功倍。在本文中介绍了
CDA数据分析师
2018/02/05
1.4K0
机器学习和 AI 领域必须了解的工具
用可视化探索数据特征的N种姿势
数据可视化是指以图形或表格的形式显示信息。成功的可视化需要将数据或信息转换成可视的形式,以便能够借此分析或报告数据的特征和数据项或属性之间的关系。可视化的目标是形成可视化信息的人工解释和信息的意境模型。
数据STUDIO
2021/06/24
2.2K0
数据处理(三)| 深入数据预处理:提升机器学习模型性能的关键步骤
今天要和大家继续讲解机器学习中一个看似枯燥但至关重要的环节——数据预处理。前面已经讲解过数据清洗和数据评质量评估(点击跳转),如果你已看过,那你已经打下了坚实的基础!今天这篇内容会更聚焦于预处理的核心技巧,手把手教你如何将原始数据“打磨”成模型的最爱。
CoovallyAIHub
2025/03/03
2590
数据处理(三)| 深入数据预处理:提升机器学习模型性能的关键步骤
机器学习实战 | SKLearn入门与简单应用案例
教程地址:http://www.showmeai.tech/tutorials/41
ShowMeAI
2022/03/21
1.3K0
机器学习实战 | SKLearn入门与简单应用案例
Scikit-learn的模型设计与选择
目的:本文的目的是从头到尾构建一个管道,以便在合成数据集上访问18个机器学习模型的预测性能。
代码医生工作室
2019/07/12
2.4K0
Scikit-learn的模型设计与选择
深入Scikit-learn:掌握Python最强大的机器学习库
在人工智能大潮的推动下,机器学习作为一项核心技术,其重要性无需过多强调。然而,如何快速高效地开展机器学习实验与开发,则是许多科研工作者和工程师们面临的挑战。Python作为一种简洁易读、拥有丰富科学计算库的编程语言,已广泛应用于机器学习领域。而在Python的众多机器学习库中,Scikit-learn以其全面的功能、优良的性能和易用性,赢得了众多用户的喜爱。在本篇文章中,我们将深入探讨Scikit-learn的使用方法和内部机制,帮助读者更好地利用这一工具进行机器学习实验。
TechLead
2023/10/21
1.8K0
深入Scikit-learn:掌握Python最强大的机器学习库
【机器学习】从理论到实践:决策树算法在机器学习中的应用与实现
决策树由节点和边组成,其中每个节点表示数据集的某个特征,每条边表示特征的某个值所对应的分支。决策树的最顶端称为根节点,叶节点代表决策结果。以下是一个简单的决策树示例图:
哈__
2024/06/23
4170
【机器学习】从理论到实践:决策树算法在机器学习中的应用与实现
7000 字精华总结,Pandas/Sklearn 进行机器学习之特征筛选,有效提升模型性能
作者 | 俊欣 来源 | 关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征的数量会带来许多的好处,例如 提高预测的精准度 降低过拟合的风险 加快模型的训练速度 增加模型的可解释性 事实上,很多时候也并非是特征数量越多训练出来的模型越好,当添加的特征多到一定程度的时候,模型的性能就会下降,从下图中我们可以看出, 因此我们需要找到哪些特征是最佳的使用特征,当然我们这里分连续型的变
AI科技大本营
2023/04/14
8110
7000 字精华总结,Pandas/Sklearn 进行机器学习之特征筛选,有效提升模型性能
机器学习建模高级用法!构建企业级AI建模流水线 ⛵
我们知道机器学习应用过程包含很多步骤,如图所示『标准机器学习应用流程』,有数据预处理、特征工程、模型训练、模型迭代优化、部署预估等环节。
ShowMeAI
2022/08/09
1.3K0
机器学习建模高级用法!构建企业级AI建模流水线 ⛵
【机器学习基础】关于Scikit-Learn,你不一定知道的10件事
Scikit-learn是使用最广泛的Python机器学习库之一。它有一个标准化和简单的接口用来预处理数据和进行模型的训练,优化和评估。
黄博的机器学习圈子
2020/07/24
1.1K0
【机器学习基础】关于Scikit-Learn,你不一定知道的10件事
强大的 Scikit-learn 可视化让模型说话
使用 utils.discovery.all_displays 查找可用的 API。
数据STUDIO
2024/05/10
2760
强大的 Scikit-learn 可视化让模型说话
用Python与Scikit-learn构建高效机器学习模型
文章链接:https://cloud.tencent.com/developer/article/2472162
一键难忘
2024/11/29
2950
牛逼了!Scikit-learn 0.22新版本发布,新功能更加方便
作者:xiaoyu,数据爱好者 Scikit-learn此次发布的版本为0.22。我浏览了一下,此次版本除了修复之前出现的一些bug,还更新了很多新功能,不得不说更加好用了。下面我把我了解到主要的几个最新功能和大家分享一下。
Python数据科学
2019/12/18
1.4K0
推荐阅读
相关推荐
这5个机器学习项目你不可错过!(附代码)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验