将JSON列中的数据直接从数据库中提取到pandas数据帧中,可以通过以下步骤实现:
以下是一个示例代码:
import pandas as pd
import mysql.connector
# 连接数据库
conn = mysql.connector.connect(
host='localhost',
user='username',
password='password',
database='database_name'
)
# 查询数据
query = "SELECT json_column FROM table_name"
cursor = conn.cursor()
cursor.execute(query)
# 获取结果集
results = cursor.fetchall()
# 转换为数据帧
df = pd.read_sql(query, conn)
# 处理JSON列
df['json_column'] = df['json_column'].apply(pd.json_normalize)
# 关闭数据库连接
cursor.close()
conn.close()
# 打印数据帧
print(df)
在上述代码中,需要根据实际情况修改数据库连接的参数(如主机名、用户名、密码、数据库名)、查询语句中的表名和列名。另外,根据JSON列的具体结构,可能需要进一步处理数据帧中的列。
领取专属 10元无门槛券
手把手带您无忧上云