可以通过以下步骤实现:
df['column_name']
语法来选择列。例如,如果需要选择名为"column1"和"column2"的两列,可以使用df[['column1', 'column2']]
。set()
函数。例如,如果选择的列为df['column1']
,可以使用set(df['column1'])
来创建集合。value_counts()
函数。该函数会返回每个唯一值的计数,并以字典的形式返回。例如,如果选择的列为df['column1']
,可以使用df['column1'].value_counts().to_dict()
来创建计数字典。下面是一个完整的示例代码:
import pandas as pd
# 创建一个示例dataframe
data = {'column1': [1, 2, 3, 4, 5],
'column2': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)
# 选择需要的列
selected_columns = df[['column1', 'column2']]
# 创建集合
column1_set = set(selected_columns['column1'])
column2_set = set(selected_columns['column2'])
# 创建计数字典
column1_dict = selected_columns['column1'].value_counts().to_dict()
column2_dict = selected_columns['column2'].value_counts().to_dict()
print("column1集合:", column1_set)
print("column2集合:", column2_set)
print("column1计数字典:", column1_dict)
print("column2计数字典:", column2_dict)
输出结果:
column1集合: {1, 2, 3, 4, 5}
column2集合: {'c', 'd', 'e', 'b', 'a'}
column1计数字典: {1: 1, 2: 1, 3: 1, 4: 1, 5: 1}
column2计数字典: {'c': 1, 'd': 1, 'e': 1, 'b': 1, 'a': 1}
这个例子中,我们选择了dataframe的"column1"和"column2"两列,并分别创建了对应的集合和计数字典。
领取专属 10元无门槛券
手把手带您无忧上云