我有一个名为no_borough
的数据集,其中包含街道信息。
我只想选择出现不止一次的街道。当我运行no_borough['ON STREET NAME'].value_counts() > 1
时,我会生成以下内容:
BELT PARKWAY True
LONG ISLAND EXPRESSWAY True
BROOKLYN QUEENS EXPRESSWAY True
GRAND CENTRAL PKWY True
FDR DRIVE True
...
HARVEST AVENUE False
6th Ave False
W 23rd St False
CRYDERS LANE False
WINFIELD STREET False
Name: ON STREET NAME, Length: 4890, dtype: bool
但是当我尝试用这个布尔值进行选择时,使用
no_borough[(no_borough['ON STREET NAME'].value_counts() > 1) == True]
我收到一个
ValueError:系列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()。
当我尝试
no_borough[no_borough['ON STREET NAME'].value_counts() > 1]
我收到一个
IndexingError:作为索引器提供的不可对齐布尔序列(布尔序列和索引对象的索引不匹配)。
执行此选择的正确方法是什么?
发布于 2020-09-10 17:48:11
一种方法是;
no_borough['ON STREET NAME'].value_counts()[lambda x:x>1]
交替使用duplicated()
no_borough[no_borough['ON STREET NAME'].duplicated()]
https://stackoverflow.com/questions/63839672
复制