在Python/pandas中使用regex查找城市名称,可以通过正则表达式来匹配字符串中的城市名称。正则表达式是一种用来描述、匹配和处理字符串的强大工具。
在Python中,可以使用re模块来进行正则表达式的操作。而在pandas中,可以使用str.extract()方法来提取符合正则表达式模式的字符串。
下面是一个示例代码,演示如何使用regex在Python/pandas中查找城市名称:
import pandas as pd
# 创建一个包含城市名称的DataFrame
data = {'city': ['New York', 'Los Angeles', 'San Francisco', 'Chicago', 'Houston']}
df = pd.DataFrame(data)
# 使用regex查找城市名称
pattern = r'\b[A-Z][a-z]+\b' # 正则表达式模式,匹配首字母大写的单词
df['city_name'] = df['city'].str.extract(pattern)
# 打印结果
print(df)
输出结果如下:
city city_name
0 New York New
1 Los Angeles Los
2 San Francisco San
3 Chicago Chicago
4 Houston Houston
在上述代码中,我们首先创建了一个包含城市名称的DataFrame。然后,定义了一个正则表达式模式r'\b[A-Z][a-z]+\b'
,该模式可以匹配首字母大写的单词。接下来,使用str.extract()
方法提取符合正则表达式模式的字符串,并将结果存储在新的列city_name
中。
领取专属 10元无门槛券
手把手带您无忧上云