Pandas 是一个强大的 Python 数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。Pandas 中的 DataFrame 是一个二维表格型数据结构,可以存储多种类型的数据,并且具有很多方便的数据操作方法。
在 Pandas 中,主要的数据结构类型包括:
Pandas 广泛应用于数据分析、数据挖掘、机器学习等领域。例如:
假设你有一个包含多个表的 CSV 文件,每个表之间通过某种标识符(如空行)分隔。你可以使用 Pandas 将这些表合并成一个 DataFrame。
import pandas as pd
# 读取 CSV 文件
with open('multi_table.csv', 'r') as file:
data = file.read()
# 将文件内容按空行分割成多个表
tables = data.strip().split('\n\n')
# 将每个表转换为 DataFrame,并存储在列表中
dataframes = []
for table in tables:
df = pd.read_csv(pd.compat.StringIO(table))
dataframes.append(df)
# 将所有 DataFrame 合并成一个大的 DataFrame
combined_df = pd.concat(dataframes, ignore_index=True)
# 显示合并后的 DataFrame
print(combined_df)
open
函数读取 CSV 文件内容。pd.read_csv
将每个表转换为 DataFrame,并存储在列表中。pd.concat
将所有 DataFrame 合并成一个大的 DataFrame。通过上述方法,你可以将包含多个表的 CSV 文件转换为一个统一的 DataFrame,便于后续的数据处理和分析。
领取专属 10元无门槛券
手把手带您无忧上云