-1编码:
html = requests.get(url, timeout=10).content.decode('latin-1')
不过这里遗留了几个问题:
0xe7是什么?...latin-1是什么编码?
下面就要聊一聊这些问题....不过提起别称就清楚了,它就是Latin-1编码.
Latin-1属于单字节编码,最多能表示0-255的范围,即$2^8$,所以0xe7就在它的表示范围内,因此可以解码....单字节编码的问题是能够表示的字符很少,但是单字节和计算机最基础的表示单位一致,所以面对其他编码的中文表示,可以拆成一个一个的单字节,用Latin-1进行保存.所以就像上面UTF-8对鱼的表示一样,用Latin...-1解码后,单个字节拼起来就是UTF-8编码了:
>>> b'鱼'.decode('Latin-1')
u'\xe9\xb1\xbc'
以上,问题解决.