Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python使用三种方法批量修改记事本文件编码格式

Python使用三种方法批量修改记事本文件编码格式

作者头像
Python小屋屋主
发布于 2018-07-23 07:19:43
发布于 2018-07-23 07:19:43
7050
举报
文章被收录于专栏:Python小屋Python小屋

应用背景:近期计划写一个贝叶斯算法邮件分类的教学案例,苦于没有足够的训练集,就让同学们帮忙每人从自己的邮箱中找几封垃圾邮件把内容复制下来放到记事本文件中发给我,但是忘了提前统一编码格式要求,所以收到的记事本文件编码格式不一样,一个一个修改太麻烦,于是就有了下面的代码,用来把当前文件夹中所有记事本文件批量修改为UTF8编码格式。

方法一:

方法二:

方法三:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
详解Python字符串编码格式
最早的字符串编码是美国标准信息交换码ASCII,仅对10个数字、26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。ASCII采用1个字节来对字符进行编码,最多只能表示256个符号。 随着信息技术的发展和信息交换的需要,各国的文字都需要进行编码,不同的应用领域和场合对字符串编码的要求也略有不同,于是又分别设计了多种不同的编码格式,常见的主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP936、base64、CP437等等。UTF-8编码是国际通用的编码,以1个字节表示英语字
Python小屋屋主
2018/04/16
1.9K0
织梦DEDECMS模板编码格式从UTF-8换成GB2312
我们很多朋友在利用DEDECMS织梦程序建站的时候,由于程序本身是有多个编码版本的,比如有UTF-8和GB2312的,我们的主程序安装好之后但是在选择主题模板的时候也是有编码区别的,这个就比较难搞。我们要么就重新安装同主题模板一样编码的主程序,要么就是更换主程序编码。
老蒋
2021/12/27
4.4K0
Python处理Windows记事本utf8编码文件要注意的坑
以Win 10为例,假设当前文件夹中有个ANSI编码的文本文件data.txt,其中包含若干行文本,每行存放一个整数,例如:
Python小屋屋主
2020/04/03
2K0
真棒!彻底解决了一直困扰的编码问题
在批量处理文件(后缀包括 ".csv"、".xlsx"、".xls"的文件)时,可能会出现同一个文件夹内同时存在不同编码的文件;亦或非"utf-8"格式的其他格式,即便相同格式也会出现有些文件能打开,而有些文件不能打开。
数据STUDIO
2021/06/24
1.3K0
linux 文件编码格式转换
师兄在 windows 下写的一段程序 (C/C++ 编写), 传给我在 Linux 下面运行, 编译和运行的时候输出的时候中文乱码了
明哥的运维笔记
2019/01/30
7.4K0
学习笔记 | 如何转换文本文件的编码格式
首先,我们需要一个可以读取和写入不同编码格式的函数。这里使用 Python 内置的 open 函数,它允许我们指定文件打开的模式以及编码格式。 其次,调用 sys 的 argv 进行传递参数方便直接使用脚本
用户11172986
2024/08/21
2490
学习笔记 | 如何转换文本文件的编码格式
UTF-16 Little Endian 编码的记事本文件在powershell里处理字符串时一定要小心
记事本文件c:\teaport6.log每一行最左边都是这个格式的字符串2023/7/1 1:01:33; (时间加一个英文分号)
Windows技术交流
2023/07/08
2750
Node.js文件编码格式的转换
项目很多 lua 文件不是 utf-8格式,使用 EditPlus 查看的时候,显示为ASCII。还有的是带BOM的,带BOM倒好处理,之前写过,有一定规律。
meteoric
2018/11/20
5.7K0
Python学习:如何实现文件编码的检测
文件打开的原则是“ 以什么编码格式保存的,就以什么编码格式打开 ”,我们常见的文件一般是以“ utf-8 ”或“ GBK ”编码进行保存的,由于编辑器一般设置了默认的保存和打开方式,所以我们在记事本或常见文档编辑器如Word中不容易看到乱码的情况发生,但是,当我们要在内存里读取打开一个文件时,如果文档编码方式和计算机内存默认读取文件的编码不同,或者我们打开文件时未设置正确的编码打开规则,则很有可能出现一堆乱码,无法正常读取文件内容,影响接下来的工作。
Python学习者
2022/09/13
7560
用记事本编写第一个Java程序
编写的,之所以不用开发工具是因为想要了解如何通过doc编译和执行Java程序 系统:windows10 Java:jdk1.8版本 Java文件位置:E盘-test文件夹
小沐沐吖
2022/09/09
6940
用记事本编写第一个Java程序
java判断文本文件编码格式
上篇文章需要读取当前java或者配置文件的编码格式,这里主要支持UTF-8、GBK、UTF-16、Unicode等
一笠风雨任生平
2019/08/07
9.1K6
AVI视频文件编码格式不受支持0xc00d5212怎么解决?「建议收藏」
AVI视频格式的优点是图像质量好,但最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频。
全栈程序员站长
2022/11/14
11K0
AVI视频文件编码格式不受支持0xc00d5212怎么解决?「建议收藏」
从零开始学习PYTHON3讲义(十三)记事本的升级版:网络记事本
网络编程的火热和重要性这里就不多说了,我们直接来看看Python在互联网编程方面的表现。
俺踏月色而来
2019/01/03
8020
【解决 Excel 打开 UTF-8 编码 CSV 文件乱码的 BUG 】
在日常数据处理工作中,我们经常会使用CSV文件进行数据的导入和导出。然而,当CSV文件采用UTF-8编码时,有时候在使用Excel打开这些文件时会遇到乱码的问题,这可能会影响数据的正确性和可读性。在本文中,我们将分享如何解决Excel打开UTF-8编码CSV文件乱码的BUG问题,并提供一些实用的方法。
老虎也淘气
2024/01/30
13.3K0
【解决 Excel 打开 UTF-8 编码 CSV 文件乱码的 BUG 】
[Python零基础入门篇①⑧] - 字符串的编码格式
编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。
哈哥撩编程
2024/06/30
2900
[Python零基础入门篇①⑧] - 字符串的编码格式
中文编码格式都读取不了文件csv,还有什么方法解决吗?
前几天在Python奥特曼交流群【Meiloi】问了一个文件处理的问题。问题如下图所示:这么多中文编码格式都读取不了文件csv,还有什么方法解决吗?
前端皮皮
2024/01/23
1820
中文编码格式都读取不了文件csv,还有什么方法解决吗?
各种编码格式,你懂得!!!
GBK,ISO-8859-1,GB2312的本质区别 编码有几种 ,计算机最初是在美国等国家发明的 所以表示字符只有简单的几个字母只要对字母进行编码就好 我们标准码 iso-8859-1 这就是一个标准 但是后来计算机普及了 于是就中国要使用计算机了 但是机器不认得中文,于是就有了国际码。 gbk gb2312都是这类。两个其实一个,一个是标准(发布的代号),一个是简称。后来多了个阿拉伯语、日语、韩语......所以就出来统一编码UniCode ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。此字符集主要支持欧洲使用的语言。
李才哥
2019/07/10
11.2K0
各种编码格式,你懂得!!!
视频编码格式和封装格式有什么关系?相机常见的编码格式有哪些?
业内有个很形象的比喻,可以带大家很快弄清楚封装格式和编码的关系:编码格式和封装格式的关系好比酒与酒瓶的关系,编码格式就像酒瓶里的酒,是视频的核心内容,封装格式就像酒瓶,它只是负责把内部的视频轨、音频轨、字幕轨集成在一起。简单说,视频编码格式是视频的内核,封装格式是视频的外壳,因此编码格式与封装格式对文件大小的影响也截然不同。
微帧Visionular
2024/10/30
6080
视频编码格式和封装格式有什么关系?相机常见的编码格式有哪些?
字符编码
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://polaris.blog.51cto.com/1146394/377468
拾点阳光
2018/09/28
2.3K0
Linux下文件字符编码格式检测和转换
目前多数情况下, 我们遇到的非英文字符文件都是使用UTF-8编码的, 这时一般我们查看这些文件的内容都不会有问题. 不过有时, 我们有可能会遇到非UTF-8编码的文件, 比如中文的GBK编码, 或者俄语的CP1251编码. 而文本文件一般不带有自身编码格式的信息, 这就给我们处理带来很多麻烦. 本文介绍几个Linux命令来检测和转换文本文件的编码格式.
别先生
2020/10/10
5.6K0
推荐阅读
相关推荐
详解Python字符串编码格式
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档