在Pandas中,DataFrame是一种二维表格数据结构,类似于Excel表或SQL表。你可以基于现有列的值来创建新的列。
基于其他列的ID值创建新列通常涉及以下几种类型:
假设我们有一个DataFrame,包含以下列:ID
, Name
, Age
。我们想基于ID
列的值创建一个新的列Category
,规则如下:
ID
小于100,Category
为A
ID
在100到200之间,Category
为B
Category
为C
import pandas as pd
# 创建示例DataFrame
data = {
'ID': [50, 150, 250, 75, 125],
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
'Age': [25, 30, 35, 40, 45]
}
df = pd.DataFrame(data)
# 基于ID列创建新列Category
df['Category'] = df['ID'].apply(lambda x: 'A' if x < 100 else ('B' if 100 <= x < 200 else 'C'))
print(df)
ID Name Age Category
0 50 Alice 25 A
1 150 Bob 30 B
2 250 Charlie 35 C
3 75 David 40 A
4 125 Eva 45 B
通过上述示例代码,你可以看到如何基于其他列的ID值创建新列。Pandas提供了灵活且高效的数据操作功能,使得这类任务变得简单易行。
领取专属 10元无门槛券
手把手带您无忧上云