前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python 读写txt文件乱码问题

python 读写txt文件乱码问题

作者头像
全栈程序员站长
发布于 2022-07-23 08:15:34
发布于 2022-07-23 08:15:34
1.8K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

从报错讲起:

UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaa in position 2: illegal multibyte sequence

出现这个错误一般是由于打开文件时,没有指定编码引起的,比如下面代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
with open('../corpus.txt', mode = 'r') as f:

解决方法很简单,为其指定编码就行了

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
with open('../corpus.txt', encoding='utf-8',  mode = 'r') as f:

还有一个常见的问题就是,生成txt文件,查看内容时发现乱码,这可能与你在打开文件时没有指定编码方式有关

代码就像这样

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
output = open('context.txt', 'w')

解决的方式也很简单,只要在打开文件时,指定文件编码就行了

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
output = open('context.txt', 'w', encoding="utf-8")

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/126717.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年4月8,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
加入讨论
的问答专区 >
1程序员擅长1个领域
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档