首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >非英文键盘上的字符编码是否不同,可能不是有效的xml?

非英文键盘上的字符编码是否不同,可能不是有效的xml?
EN

Stack Overflow用户
提问于 2014-01-11 02:23:22
回答 1查看 38关注 0票数 0

我有一个遗留的应用程序,其中来自不同国家的人填写Q&A并将它们发送到我们的服务器。一旦它到达我们的服务器,所有东西都被转换成XML,以便能够在服务器之间轻松地传递。我已经收到一些非英语国家的用户的报告,他们上传的内容没有传到服务器上,查看日志文件,似乎被给出的答案卡住了。

我让他们截取他们试图提交的答案的屏幕截图,他们认为非英语字符是无效的XML字符,但屏幕截图中的所有内容看起来都像普通字符(字母数字、:和。大多数情况下)。

更奇怪的是,我接受了和他们一样的答案,并使用我的(英语)键盘上传了表格,没有遇到任何错误。

有没有可能,即使视觉表示看起来像普通的ASCII字符,但它们实际上是不同的编码,并导致问题,因为它们是在非英语键盘上键入的?

EN

回答 1

Stack Overflow用户

发布于 2014-01-11 02:30:55

XML通常是UTF-8编码的,也许您的代码没有考虑到这一点?如果UTF在标记名中,这是特定于实现的。如果UTF是标记之间的值,听起来就是这样,应该没问题。

如果键盘来自拉丁/日耳曼语言,字母和重音将在它们之间匹配为ASCII。如果您有另一种具有类似ABC字形的语言,例如俄语w/ Cyrillic,则它们的编码方式不同,因为它们可能不代表拉丁语/日耳曼语用户所知道的发音。日语和中文甚至在非ASCII的unicode表中有自己的拉丁子集,有时这很容易被发现,因为它通常是固定宽度或不熟悉/不干净的字体。这些操作将导致泛型字符串比较失败。我相信一些脚本语言,如PHP,有一个函数可以将各种unicode字符转换成与之对应的aSCII字符。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21051608

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档