首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从用户输入的字符串中删除UTF-8

要从用户输入的字符串中删除UTF-8编码的非ASCII字符,您可以使用以下Python代码:

代码语言:javascript
复制
def remove_utf8_chars(input_str):
    return "".join(c for c in input_str if ord(c) < 128)

input_str = input("请输入字符串:")
output_str = remove_utf8_chars(input_str)
print("删除UTF-8字符后的字符串:", output_str)

这段代码定义了一个remove_utf8_chars函数,它接受一个字符串并返回一个只包含ASCII字符的新字符串。函数通过ord()函数获取每个字符的Unicode码点,并检查它是否小于128(即ASCII字符的范围)。如果是,字符会被包含在结果字符串中。

用户输入的字符串通过input()函数获取,然后传递给remove_utf8_chars函数进行处理。处理后的字符串通过print()函数输出。

请注意,这个方法也适用于其他Unicode字符集,只要您更改条件以适应相应的字符范围。例如,如果您想保留中文字符(Unicode范围为\u4e00\u9fff),可以将条件更改为ord(c) >= 0x4e00 and ord(c) <= 0x9fff

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券