我想从下面的数据框中删除中文类型的括号及其内部内容:
id title
0 1 【第一次拍卖】深圳市光明新区公明街道中心区(拍卖) ---> (拍卖)need to remove
1 2 【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2 3 【第一次拍卖】(破)广东省深圳市龙岗区布吉新区 ---> (破) need to remove
3 4 【第一次拍卖】深圳市宝安区新安街道新城大道
4 5 (拍卖)【第二次拍卖】深圳市盐田区沙头角东和路 ---> (拍卖) need to remove
我尝试使用df['title'].str.replace(r'\([^()]*\)', '')
和df['title'].str.replace(r'\([^)]*\)', '')
,但是如果它们在字符串的末尾,它们都可以删除它们。
0 【第一次拍卖】深圳市光明新区公明街道中心区 ---> this row works
1 【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2 【第一次拍卖】(拍卖)广东省深圳市龙岗区布吉新区
3 【第一次拍卖】深圳市宝安区新安街道新城大道
4 (拍卖)【第二次拍卖】深圳市盐田区沙头角东和路
如何修改我的代码以获得以下输出?谢谢。
0 【第一次拍卖】深圳市光明新区公明街道中心区
1 【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2 【第一次拍卖】广东省深圳市龙岗区布吉新区
3 【第一次拍卖】深圳市宝安区新安街道新城大道
4 【第二次拍卖】深圳市盐田区沙头角东和路
发布于 2020-03-09 11:02:00
以下三种解决方案有效:
df['title'].str.replace(r'\([^()]*\)', '')
df['title'].str.replace(r'\([^)]*\)', '')
df['title'].str.replace(r'\(\S+\)', '')
输出:
0 【第一次拍卖】深圳市光明新区公明街道中心区
1 【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2 【第一次拍卖】广东省深圳市龙岗区布吉新区
3 【第一次拍卖】深圳市宝安区新安街道新城大道
4 【第二次拍卖】深圳市盐田区沙头角东和路
https://stackoverflow.com/questions/60594127
复制相似问题