Pandas 是一个用于数据操作和分析的 Python 库。它提供了 DataFrame 和 Series 等数据结构,使得数据处理变得高效且简单。DataFrame 是一个二维表格型数据结构,类似于 Excel 表格或 SQL 表。
假设我们有两个列表 list1
和 list2
,我们希望创建一个新的 DataFrame,其中包含 list1
的元素,并且如果 list1
中的元素存在于 list2
中,则在新列中添加 list2
中的匹配元素。
import pandas as pd
# 示例列表
list1 = [1, 2, 3, 4, 5]
list2 = [3, 4, 5, 6, 7]
# 创建 DataFrame
df = pd.DataFrame(list1, columns=['A'])
# 检查 list1 中的元素是否在 list2 中,并添加新列
df['B'] = df['A'].apply(lambda x: x if x in list2 else None)
print(df)
A B
0 1 NaN
1 2 NaN
2 3 3.0
3 4 4.0
4 5 5.0
list1
转换为一个 DataFrame,列名为 'A'。apply
方法和一个 lambda 函数来检查 list1
中的每个元素是否存在于 list2
中。如果存在,则将该元素添加到新列 'B' 中,否则添加 None
。通过这种方式,我们可以高效地处理数据,并根据特定条件添加新列。
领取专属 10元无门槛券
手把手带您无忧上云