Pandas 是一个强大的 Python 数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。它主要包括两个核心数据结构:Series(一维数组)和 DataFrame(二维表格)。DataFrame 是一个表格型的数据结构,可以看作由 Series 组成的字典。
假设我们有一个 DataFrame,包含学生的成绩信息,我们希望替换部分学生的成绩,并创建一个新的列来表示是否及格。
import pandas as pd
# 创建示例 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Score': [85, 60, 75, 55]
}
df = pd.DataFrame(data)
# 替换部分学生的成绩
df.loc[df['Name'] == 'Bob', 'Score'] = 65
# 创建新列表示是否及格(假设及格分数线为 60)
df['Passed'] = df['Score'] >= 60
print(df)
Name Score Passed
0 Alice 85 True
1 Bob 65 True
2 Charlie 75 True
3 David 55 False
df.loc
方法可以根据条件选择特定的行并修改其值。通过以上示例和解释,你应该能够理解如何在 Pandas 中替换部分行并创建新列。如果你遇到具体的问题或错误,请提供详细信息以便进一步帮助你解决。
领取专属 10元无门槛券
手把手带您无忧上云