我正在尝试使用Python将打开的SPSS数据集中的数据写入到excel文件中。下面的程序运行良好,但对于具有140万个数据点(2500个情况,700个变量)的文件,它需要大约35秒。现在,我循环遍历每个case (作为元组),然后将元组的每个元素分配到一个单元中。openpyxl是Excel的首选模块(因为我过去没有使用过任何其他模块)。我将对更大的数据集使用Python程序,所以我想知道是否有更有效的逻辑来做这件事。
BEGIN
- OpenOffice would properly handle charset and multilines but it can't handle that many columns.
- Excel如果你说xlsx::write.xlsx:这很有效,但要花费非常长的时间(10m),而且在SPSS吃掉生成的xlsx文件之前,我必须手动打开它们并在Excel中重新保存它们(我还没有找到SPSS不喜欢它们的地方我还没有尝试建立一个数据库,并在Exc