Python是一种用于进行数据分析的优秀语言,主要是因为它有很多以数据为中心的packages可以使用,Pandas就是其中一个软件包,可以更轻松地导入和分析数据。
pandas 是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
在分析数据时,很多时候用户想要查看特定列中的唯一值。Pandas nunique() 用于获取唯一值的统计次数。
dropna 默认参数设置为True,因此在计算唯一值时排除了NULL值。
例子1# :
在此示例中,nunique() 方法用于获取 'Team' 列中所有唯一值的数量。
# importing pandas package
importpandasaspd
# 下载 employees.csv的地址
#https://cdncontribute.geeksforgeeks.org/wp-content/uploads/employees.csv
data = pd.read_csv("employees.csv")
# 统计“Team”列中不同值的个数,不包括null值
unique_value = data["Team"].nunique()
# printing value
print(unique_value)
#Output:10
例子2# :
>>>importpandasaspd
>>> df=pd.DataFrame({'A':[1,2,3],
'B':[4,5,6]})
>>> df.nunique()
A3
B3
dtype: int64
>>> df=pd.DataFrame({'A':[1,1,2],
'B':[4,5,6]})
>>> df.nunique()
A2
B3
dtype: int64
从例子可以清楚看出,nuinque()这个函数分别统计每一列属性各自有多少个不同值。
领取专属 10元无门槛券
私享最新 技术干货