要从用户输入的字符串中删除UTF-8编码的非ASCII字符,您可以使用以下Python代码:
def remove_utf8_chars(input_str):
return "".join(c for c in input_str if ord(c) < 128)
input_str = input("请输入字符串:")
output_str = remove_utf8_chars(input_str)
print("删除UTF-8字符后的字符串:", output_str)
这段代码定义了一个remove_utf8_chars
函数,它接受一个字符串并返回一个只包含ASCII字符的新字符串。函数通过ord()
函数获取每个字符的Unicode码点,并检查它是否小于128(即ASCII字符的范围)。如果是,字符会被包含在结果字符串中。
用户输入的字符串通过input()
函数获取,然后传递给remove_utf8_chars
函数进行处理。处理后的字符串通过print()
函数输出。
请注意,这个方法也适用于其他Unicode字符集,只要您更改条件以适应相应的字符范围。例如,如果您想保留中文字符(Unicode范围为\u4e00
到\u9fff
),可以将条件更改为ord(c) >= 0x4e00 and ord(c) <= 0x9fff
。
领取专属 10元无门槛券
手把手带您无忧上云