我有一个广泛使用德语元音的文件。我写了一个脚本来处理这个文件,它在原生R (RStudio)中正常工作。不幸的是,当使用人人网时,所有的变音都被设置为文件字符串中的未知字符。由于文件结构的原因,我使用readLines-命令来读取文件。在这种情况下,命令read.table()不是一个合适的解决方案。
我想使用人人网,因为我在Java团队中工作,在人人网的帮助下,我可以保护我们的工作环境,当然,这是基于Java的。
Java正确地识别了变音(使用了正确的文件编码)。我还检查了人人网是否正确地打印了变音,但它没有。我已经尝试在人人网中将R的地区设置为“German_Germany.1252”。因此,我使用了以下R命令:
engine.eval("Sys.setlocale(category = 'LC_ALL', locale = 'German_Germany.1252')")
然后正确设置local。然而,人人网根本不识别元音。我在打印文件的一行时检查了它,但也使用了直接传递给人人网的单个字符(使用:engine.eval("print('äöß')")
)。
你知道怎么解决这个问题吗?如果没有,我应该在github上开一个问题吗?
发布于 2017-07-13 11:37:36
我怀疑这是人人网对非unicode字符集的尊重的问题。
默认情况下,人人到处使用Unicode,并使用UTF-8读写流。
如果这是不可能的,那么请使用一个小的测试文件和脚本在GitHub上打开一个问题。
https://stackoverflow.com/questions/45059548
复制相似问题