从pandas数据框列中剥离符号可以通过以下步骤实现:
import pandas as pd
import re
data = {'col1': ['$100', '$200', '$300'], 'col2': ['€400', '¥500', '£600']}
df = pd.DataFrame(data)
def strip_symbols(value):
pattern = r'[^0-9.]' # 正则表达式模式,匹配除数字和小数点以外的字符
return re.sub(pattern, '', value)
df['col1_stripped'] = df['col1'].apply(strip_symbols)
df['col2_stripped'] = df['col2'].apply(strip_symbols)
print(df)
输出:
col1 col2 col1_stripped col2_stripped
0 $100 €400 100 400
1 $200 ¥500 200 500
2 $300 £600 300 600
这样,我们通过定义一个函数并应用到数据框的列上,成功地从pandas数据框列中剥离了符号。在这个例子中,我们使用了正则表达式来匹配除数字和小数点以外的字符,并使用re.sub()函数将匹配到的字符替换为空字符串。最后,我们将处理后的结果存储在新的列中。
领取专属 10元无门槛券
手把手带您无忧上云