Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >是否有Python库函数试图猜测某些字节的字符编码?

是否有Python库函数试图猜测某些字节的字符编码?

提问于 2018-03-13 17:21:34
回答 2关注 0查看 194

我正在用Python编写一些邮件处理软件,它在头字段中遇到奇怪的字节。

我正在寻找一个函数,它str可以提供一些提示,并且可以提供一些提示,并且可以让我回馈一个提示unicode

回答 2

迷迷

发布于 2018-03-14 02:36:31

你可以使用以下命令轻松安装它:

代码语言:javascript
运行
AI代码解释
复制
$ pip install chardet

示例代码如下:

代码语言:javascript
运行
AI代码解释
复制
>>> import chardet
>>> import urllib
>>> detect = lambda url: chardet.detect(urllib.urlopen(url).read())
>>> detect('http://stackoverflow.com')
{'confidence': 0.85663169917190185, 'encoding': 'ISO-8859-2'}    
>>> detect('https://stackoverflow.com/questions/269060/is-there-a-python-lib')
{'confidence': 0.98999999999999999, 'encoding': 'utf-8'}

璟櫆

发布于 2018-03-14 01:51:21

你可以了解通用编码检测器来找到解决办法。

和开发者交流更多问题细节吧,去 写回答
相关文章
字符串,字节和字符编码
下载一个名为 languages.txt 的文本文件。(下载地址: https://learnpythonthehardway.org/python3/languages.txt,点开,右键,“另存为” txt 格式,放在你的练习文件夹,再打开。)
Tia
2020/09/23
1K0
字符串,字节和字符编码
字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码
字符是人们常用的一些记号,比如”1”, “汉”, “お”,”℃”等等,包括各种语系的语言和一些符号都可以被称为字符。 字节是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)。 编码是大家对计算机如何使用字节来表示一个字符的约定,可分为ASCII编码,ANSI编码(本地化编码),UNICODE编码(国际化编码)三种。 1.ASCII编码:单字节编码。 最初的编码,由一个字节组成,因此只能表示256个字符,但只表示0-9,a-z,A-Z,和一些加减乘除百分号,够老美用了
学到老
2018/03/19
3.4K0
字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码
字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码
字符是人们常用的一些记号,比如”1”, “汉”, “お”,”℃”等等,包括各种语系的语言和一些符号都可以被称为字符。 字节是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)。 编码是大家对计算机如何使用字节来表示一个字符的约定,可分为ASCII编码,ANSI编码(本地化编码),UNICODE编码(国际化编码)三种。
学到老
2019/02/14
4.4K0
python字符编码
近期接触到python的编码相关的东西,发现自己了解的不是太系统,故通过搜索资料做了一些总结。
py3study
2020/01/13
1.6K0
检测字节流是否是UTF8编码
几天前偶尔看到有人发帖子问“如何自动识别判断url中的中文参数是GB2312还是Utf-8编码” 也拜读了wcwtitxu使用巨牛的正则表达式检测UTF8编码的算法。 使用无数或条件的正则表达式用起来
葡萄城控件
2018/01/10
2.2K0
检测字节流是否是UTF8编码
刨根究底字符编码之九——字符编码方案的演变与字节序
前文已经提及,编号字符集CCS(简称字符集)与字符编码方式CEF(简称编码方式)这两个概念,在早期并没有必要严格区分。
笨笨阿林
2019/01/18
8950
python 之字符编码
相同点:python解释器是解释执行文件内容的,因而python解释器具备读py文件的功能,这一点与文本编辑器一样
全栈程序员站长
2022/07/21
8350
python 之字符编码
Python字符与字节新编
它是一个全球化的标准,能表示世界上所有语言的字符。Unicode字符的标识(码位)是以4~6个十六进制数字表示的,并且加前缀U+。
dongfanger
2021/06/17
7340
Python字符与字节新编
Python字符编码(下)
三.二进制 blist = [1, 2, 3, 255] the_bytes = bytes(blist) #无法改变 the_byte_array = bytearray(blist) #可以当列表添加 import struct valid_png_header = b'\x89PNG\r\n\x1a\n' data = b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR' + \     b'\x00\x00\x00\x9a\x00\x00\x00\x8d\x08\x02\x0
陈不成i
2021/06/18
6040
Python字符编码(上)
一.文档 #字符 import unicodeata lookup()——接受不区分大小写的标准名称,返回一个 Unicode 字符 name()——接受一个 Unicode 字符,返回大写形式的名称 unicodeata.name('A') snowman.encode('utf-8') #指定字符编码 #验证ASCII def unicode_test(value): import unicodedata     name = unicodedata.name(value)     value2 =
陈不成i
2021/06/18
4360
python-字符编码
注·比如,简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示 256 x 256 = 65536 个符号,所以两个字节其实也不够表示出所有的中文,遇到生僻字可能需要更多位来表示。
HammerZe
2022/03/25
7780
python-字符编码
python字符的编码与解码
计算机里面是由各种电子电路组成的,它是如何识别我们的写的字符的,比如hello ,你,我。
叶子陪你玩
2020/05/14
1.2K0
js 正则是否包含某些字符串_js判断字符串中是否包含某个字符串[通俗易懂]
console.log(str.indexOf(“3”) != -1);//true
全栈程序员站长
2022/09/27
4.6K0
字符与字节有什么区别呢?
1、计算机存储信息的最小单位,称之为位(bit),音译为比特,二进制的一个“0”或一个“1”叫一位。 2、计算机存储容量基本单位是字节(Byte),音译为拜特,8个二进制位组成1个字节。一般而言:一个标准英文字母占一个字节位置,一个标准汉字占二个字节位置。 3、计算机存储容量大小以字节数来度量,1024进位制:   1024B=1K(千)B   1024KB=1M(兆)B   1024MB=1G(吉)B   1024GB=1T(太)B   以下还有PB、EB、ZB、YB 、NB、DB,一般人不常使用了。 4、字符是一种符号,同以上说的存储单位不是一回事。
黑泽君
2018/10/11
14.1K0
Python chardet 字符编码判
使 用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码 很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。
py3study
2020/01/09
5250
python基础之字符编码
计算机由美国人发明,最早的字符编码为ASCII,只规定了英文字母数字和一些特殊字符与数字的对应关系。最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号
py3study
2020/01/19
7030
python基础之字符编码
python 字符编码处理总结
python中经常遇到这样那样的字符编码问题,尤其在处理网页源码时(特别是爬虫中):
昱良
2018/09/29
6170
java按字节、字符、行、随机读取文件,并设置字符编码格式
inputStream:是字节输入流的所有类的超类,是一个抽象类;返回0-225内的字节值,如果没有字节可以读取则返回-1;
全栈程序员站长
2022/06/30
1.4K0
字符编码、python2和python3编码的区别
要想不出现乱码,文件中的字符按什么标准编码,就用什么标准去读取文件(解码)。由于内存中固定使用Unicode编码,我们只能改变存储到硬盘时使用的编码格式。
GH
2022/05/10
5220
字符编码、python2和python3编码的区别
点击加载更多

相似问题

Python中的==和`is`是否有区别?

2385

支持的音频的编码方式、封装格式有哪些?

1430

是否有录音?

099

是否有折扣?

1144

RTMP协议推送前端的H.265编码视频流,腾讯云是否有协议和格式?

1367
相关问答用户
腾讯云TDP | TDP会员擅长3个领域
平安资管 | 架构师擅长4个领域
擅长3个领域
擅长5个领域
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档