,可以通过以下步骤实现:
import pandas as pd
import json
data = {'col1': ['apple', 'banana', 'orange'],
'col2': ['cat', 'dog', 'elephant'],
'col3': ['apple pie', 'banana bread', 'orange juice']}
df = pd.DataFrame(data)
keywords_to_remove = ['apple', 'banana']
apply
函数和lambda
表达式删除包含特定关键字的列:df = df.apply(lambda x: x.str.replace('|'.join(keywords_to_remove), ''))
df.to_json('output.json', orient='records')
完整的代码如下:
import pandas as pd
import json
data = {'col1': ['apple', 'banana', 'orange'],
'col2': ['cat', 'dog', 'elephant'],
'col3': ['apple pie', 'banana bread', 'orange juice']}
df = pd.DataFrame(data)
keywords_to_remove = ['apple', 'banana']
df = df.apply(lambda x: x.str.replace('|'.join(keywords_to_remove), ''))
df.to_json('output.json', orient='records')
这段代码将会从dataframe的每一列中删除包含特定关键字的部分,并将处理后的结果保存为名为"output.json"的json文件。
领取专属 10元无门槛券
手把手带您无忧上云