显然,R包中的winsorize函数、DescTool中的winsorize函数和Python库中的winsorize函数( scipy.stats.mstats )产生了不同的结果。下面是一个简单的测试:library(DescTools)Winsorize(data, probs=c(0.025, 1-0.025))import numpy as np
from scipy.stats.mstats import wi
out with exit status 1:
command: /home/anamaria/workspace/licenta/AllFest2/festivals/venv/bin/python/setup.py'"'"'; __file__='"'"'/tmp/pip-install-r9q6vdlo/django
我正在使用python和numpy/scipy为一个文本处理应用程序执行正则表达式和词干分析。但我也想使用R的一些统计软件包。
将数据从python传递到R的最佳方式是什么?(然后呢?)另外,我需要在某个时刻将数组备份到磁盘,所以如果这是最好的解决方案,我愿意从python中保存并加载th R。矩阵非常大(例如,100,000 x 10,000),所以使用稀疏矩阵可能也很好。