字符串是一些非ascii字符,如中文,XXX是字符串的当前编码。>>> u'中文' == '中文'.decode('gbk')//The first one is u'\xd6\xd0\xce\xc4' while the second one u'\我使用的是中文简化的窗口。默认编码是gbk,python也是如此。我得到了两个u
我正在从数据库中读取SQLASCII字符串,并且遇到了一些基于我声明的big5编码不能正确解码的字节。下面是简化后的问题。python的Big5编码表似乎不知道如何解码这两个字符。据我所知(我不是专家),这些是有效的中文字符,因为我可以使用Notepad++并更改编码,使它们显示为中文字符。我将它们在Notepad++中的外观与这个网站进行了比较,字符匹配,因此我假设它们是big5编码表的有效字节。print(by.decode('big5'))
b