在使用标点符号拆分pandas列中的长字符串时,可以借助pandas库中的字符串处理方法和正则表达式来实现。以下是一种常见的实现方式:
import pandas as pd
import re
df = pd.DataFrame({'column_name': ['长字符串1', '长字符串2', '长字符串3']})
df['column_name'] = df['column_name'].str.split(r'[.,!?\n]').apply(lambda x: [i.strip() for i in x])
这里的正则表达式[.,!?\\n]
表示按照逗号、句号、问号、感叹号和换行符进行拆分。
# 如果需要将拆分后的结果展开成新的列
df = df.explode('column_name')
# 如果需要将拆分后的结果存储在新的列中
df['new_column'] = df['column_name']
注意:以上代码示例仅为参考,实际使用时请根据具体情况进行调整。
关于pandas的更多用法和相关产品,你可以参考腾讯云的文档和教程:
DBTalk
腾讯云数据库TDSQL训练营
DB TALK 技术分享会
云+社区技术沙龙[第9期]
Elastic 中国开发者大会
云+社区技术沙龙第33期
DBTalk技术分享会
Techo Day 第三期
云+社区技术沙龙[第16期]
领取专属 10元无门槛券
手把手带您无忧上云