,可以使用html.unescape()
函数来实现。该函数可以将HTML实体字符转换为对应的Unicode字符。
具体步骤如下:
html
模块:import html
html_to_string()
,接收一个参数,表示要转换的HTML字符串。html.unescape()
函数将HTML字符串转换为字符串:result = html.unescape(html_string)
return result
以下是一个示例代码:
import html
import pandas as pd
def html_to_string(html_string):
result = html.unescape(html_string)
return result
# 创建一个包含HTML字符的Dataframe
df = pd.DataFrame({'html': ['<p>Hello World</p>', '<a href="https://www.example.com">Link</a>']})
# 将HTML字符转换为字符串
df['string'] = df['html'].apply(html_to_string)
print(df)
输出结果如下:
html string
0 <p>Hello World</p> <p>Hello World</p>
1 <a href="https://www.example.com">Link</a> <a href="https://www.example.com">Link</a>
在这个例子中,我们使用了html_to_string()
函数将Dataframe中的HTML字符转换为字符串,并将结果存储在新的列string
中。
领取专属 10元无门槛券
手把手带您无忧上云