Unicode(UTF-8)是一种字符编码方案,用于在计算机中表示和存储各种语言的文本。UTF-8 是 Unicode 的一种实现方式,它使用 1 到 4 个字节来表示一个字符,支持全世界上大多数语言的文字。
在 Python 中,可以使用内置的 open()
函数来读取和写入 UTF-8 编码的文件。在打开文件时,需要指定 encoding
参数为 'utf-8'
,以便正确地处理 Unicode 字符。
例如,要读取一个 UTF-8 编码的文本文件,可以使用以下代码:
with open('example.txt', 'r', encoding='utf-8') as file:
content = file.read()
在这个例子中,open()
函数打开名为 example.txt
的文件,并使用 'utf-8'
编码来读取内容。with
语句确保在操作完成后关闭文件。
要将内容写入 UTF-8 编码的文件,可以使用以下代码:
with open('example.txt', 'w', encoding='utf-8') as file:
file.write(content)
在这个例子中,open()
函数打开名为 example.txt
的文件,并使用 'utf-8'
编码来写入内容。with
语句确保在操作完成后关闭文件。
总之,在 Python 中处理 UTF-8 编码的文件时,可以使用内置的 open()
函数,并指定 encoding='utf-8'
参数来正确地读取和写入文件。
领取专属 10元无门槛券
手把手带您无忧上云