在 Pandas 中创建 DataFrame(简称 DF)是一个非常常见的操作。DataFrame 是一种二维的表格数据结构,类似于 Excel 表格或 SQL 表。你可以从多种数据源创建 DataFrame,例如字典、列表、NumPy 数组、CSV 文件等。
以下是一些常见的方法来创建 DataFrame:
import pandas as pd
# 创建一个字典
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
# 从字典创建 DataFrame
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
import pandas as pd
# 创建一个列表
data = [
['Alice', 25, 'New York'],
['Bob', 30, 'Los Angeles'],
['Charlie', 35, 'Chicago']
]
# 从列表创建 DataFrame,并指定列名
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
import pandas as pd
import numpy as np
# 创建一个 NumPy 数组
data = np.array([
['Alice', 25, 'New York'],
['Bob', 30, 'Los Angeles'],
['Charlie', 35, 'Chicago']
])
# 从 NumPy 数组创建 DataFrame,并指定列名
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
假设你有一个名为 data.csv
的 CSV 文件,内容如下:
Name,Age,City
Alice,25,New York
Bob,30,Los Angeles
Charlie,35,Chicago
你可以使用 pd.read_csv
函数从 CSV 文件创建 DataFrame:
import pandas as pd
# 从 CSV 文件创建 DataFrame
df = pd.read_csv('data.csv')
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
假设你有一个名为 data.xlsx
的 Excel 文件,内容与上面的 CSV 文件相同。你可以使用 pd.read_excel
函数从 Excel 文件创建 DataFrame:
import pandas as pd
# 从 Excel 文件创建 DataFrame
df = pd.read_excel('data.xlsx')
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
领取专属 10元无门槛券
手把手带您无忧上云