虽然题目是个问题,但简短的回答显然是否定的。我试过了。真正的问题是为什么?字符串是一些非ascii字符,如中文,XXX是字符串的当前编码。
>>> u'中文' == '中文'.decode('gbk')
False
//The first one is u'\xd6\xd0\xce\xc4' while the second one u'\u4e2d\u6587'
这个例子在上面。我使用的是中文简化的窗口。默认编码是gbk,python也是如此。我得到了两个unicode对象不相等。
更新
a =
def top_cateogries_with_home(category_id=-1)
concat(raw "<select name='category_id' id='category_id'>")
container=[]
for category in Category.top
container.push([category.name,category.id])
end
concat(raw "<option value='-1' se
我正在尝试使用Python的'langdetect‘库来检测数据文件中的外语。
for e in food['product_name'].dropna():
if detect(e) == 'zh':
print e
在这里,我试图打印在一个特定的专栏中找到的每一个中文单词。
但是,在某种程度上,我得到了以下错误消息:
LangDetectException: No features in text.
我理解当一个数字、一个空格或一个不是单词的字符串(引用代码、邮件地址.)时会发生这种情况。被发现了。
我只想抓住一个例外,并相应