作为一个数据科学家,最重要是不是写代码,而是用最简单方式探索数据,分析数据并且将结果通过Web分享。很多人可能使用Jupyter Notebook,它确实最合适的工具,但是稍微有点大。今天虫虫给大家介绍另一种更小、更便捷的选择:Pygwalker +Streamlit集成来分析和可视化数据。
概述
Pygwalker
PyGWalker,你可以称它为“Pig Walker”,全称为:Python Binding of Graphic Walker。
Pygwalker是一个流行的开源Python库,它可以简化数据分析和数据可视化的操作,可以极大简化Jupyter Notebook工作流。无需复杂的数据分析和数据可视化步骤,就可将pandas dataframe(甚至极坐标数据框)转换为类似于Tableau的交互式界面。使用Pygwalker,用户只需几个简单的拖放操作即可轻松生成散点图、折线图、条形图和直方图,无需任何编码技能。它是一款功能强大的工具,专为想要快速轻松地探索和可视化数据的数据科学家和分析师而设计。
Streamlit
Streamlit 最受欢迎的Web共享数据应用程序Python库之一。它允许用户在几分钟(而不是几周)内将数据脚本转换为Web应用程序。有了 Streamlit,妈妈再也不用担心你熬夜写代码和设计复杂的Web界面了。可以让你一键创建交互式和可共享数据应用程序。
Streamlit快速、开源且完全免费。
在Streamlit中集成PyGWalker
在为使用Pygwalker和Streamlit,需要确保本机中已设置好了Python环境(版Python 3.6或+)。
完成后,请按照以下简单步骤操作:
安装
首先,打开命令提示符或终端并运行以下命令来安装必要的依赖项:
代码
现在我们已经具备了所有依赖项,让我们创建一个包含Pygwalker的Streamlit 应用程序。创建一个名为的新Python脚本pygwalker_demo.py并将以下代码复制到其中:
集成
要启动Streamlit应用程序并开始探索数据,请在命令提示符或终端中运行以下命令:
应该看到显示一些信息:
然后就自动打开你默认的浏览器中,打开该URL。你就可以使用Pygwalker直观的拖放操作与数据进行交互并使其可视化。
图表
如果想保存Pygwalker图表的状态,只需执行以下步骤即可简单:
单击图表上的导出按钮。
单击复制代码按钮。
将复制的代码粘贴到Python脚本中需要的位置,比如:
不要忘记重新加载网页以查看Pygwalke 图表的保存状态。
总结
Pygwalker和Streamlit 是非常棒的工具,可以让数据探索和共享变得更加容易。
借助Pygwalker直观的界面和广泛的可视化选项,以及Streamlit简化构建和共享数据应用程序过程的能力,可以使用可视化UI快速构建数据应用程序,以进行数据可视化和探索。
对于数据新兵以及经验丰富的数据科学家,Pygwalker和Streamlit都可以大大增强数据分析工作流程并帮助有效地共享你的发现。
领取专属 10元无门槛券
私享最新 技术干货