我已经做了相当多的搜索,并且没有遇到任何关于在Databricks环境中使用data.table包的确切信息。我本人和其他同事在Databricks中进行了测试,试图使用data.table fread函数在一个相对较大的csv (约15 in )中读取。有人对为什么data.table在Databricks环境中表现这么差有什么建议吗?我知道这并不是真正最好地使用Databricks,而且为了性能的目的,我们应该改用SparkR,但是我们的代理有许多用户,他们可以利用现有的R代码库来利用这个平台,而不必对其进行太多的调整