首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

删除所有HTML标记和格式(RegEx)

删除所有HTML标记和格式的问题可以使用正则表达式来实现。以下是一个使用Python编写的示例代码,它使用正则表达式删除HTML标记和格式:

代码语言:python
代码运行次数:0
复制
import re

def remove_html_tags(text):
    clean = re.compile('<.*?>')
    return re.sub(clean, '', text)

html_text = "<p>这是一个<strong>示例</strong>文本。</p>"
text_without_tags = remove_html_tags(html_text)
print(text_without_tags)

输出结果将会是:

代码语言:txt
复制
这是一个示例文本。

这个示例中,我们使用了正则表达式 <.*?> 来匹配HTML标记。这个表达式的意思是匹配任何以 < 开头并以 > 结尾的字符串。通过使用 re.sub() 函数,我们可以将所有匹配到的HTML标记替换为空字符串,从而删除HTML标记和格式。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券