前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas-ai火了

pandas-ai火了

原创
作者头像
皮大大
发布2023-05-09 23:49:07
4620
发布2023-05-09 23:49:07
举报

大家好,我是Peter~

关注小屋的朋友肯定都知道小编一直在坚持写pandas相关的文章,最近的一篇请参考:

Pandas是一个基于python和numpy的数据分析库,特别擅长数据处理和数据分析。

今年AI在大模型方面十分火热,尤其是ChatGPT等工具的出现,让我们的编程更加智(失)能(业)。

最近,就有一位大佬将Pandas和AI强强联手,帮助我们更加快速便捷地分析数据。

GitHub项目地址:https://github.com/gventuri/pandas-ai

Pandas-ai现身

Github官方解释什么是pandas-ai:

Pandas AI is a Python library that adds generative artificial intelligence capabilities to Pandas, the popular data analysis and manipulation tool. It is designed to be used in conjunction with Pandas, and is not a replacement for it.

Pandas AI 是一个 Python 库,它为流行的数据分析和操作工具 Pandas 添加了生成人工智能功能。它旨在与 Pandas 结合使用,而不是它的替代品。

安装十分简单:

代码语言:python
代码运行次数:0
复制
pip install pandasai  # 命令行
!pip install pandasai  # jupyter notebook中

使用

1、导入相关的库:

代码语言:python
代码运行次数:0
复制
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI

2、模拟生成数据:

代码语言:python
代码运行次数:0
复制
import pandas as pd
from pandasai import PandasAI

df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
    "happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})

3、初始化一个llm模型

代码语言:python
代码运行次数:0
复制
from pandasai.llm.openai import OpenAI
llm = OpenAI()

4、调用大模型实例,使用提示promote

代码语言:python
代码运行次数:0
复制
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which are the 5 happiest countries?')

显示结果为:

代码语言:python
代码运行次数:0
复制
6            Canada
7         Australia
1    United Kingdom
3           Germany
0     United States
Name: country, dtype: object

另一个实例:

代码语言:python
代码运行次数:0
复制
pandas_ai.run(df, prompt='What is the sum of the GDPs of the 2 unhappiest countries?')

19012600725504

绘图功能也是轻松搞定:

代码语言:python
代码运行次数:0
复制
pandas_ai.run(
    df,
    "Plot the histogram of countries showing for each the gpd, using different colors for each bar",
)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Pandas-ai现身
  • 使用
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档