使用expss包,我通过读取R中的SPSS文件来创建交叉表。这实际上工作得很好,但是这个过程需要很长时间才能加载。我有一个文件夹,其中包含各种SPSS文件(通常只有3个文件),通过R脚本,我正在获取三个文件中最后修改的文件。 setwd('/file/path/for/this/file/SPSS')
library(expss)
expss_output_viewer()
#get all .sav files
all_sav <- list.files(pattern ='\\.sav$')
#use file.info to get the
这是我第一次使用python和spss。我希望在同一个目录中循环几个文件,创建一个新变量,然后保存该文件。我目前拥有的是:
begin program.
import spss, spssaux
schools = ['school1', 'school2', 'school3']
for x in schools:
spssaux.OpenDataFile("C:\...\" + x + "2014.sav")
school = x
end program.
我希望这将打开每个文件(school120
我在google中创建了一个简单的python程序,其中我必须在代码中导入/加载一个.sav文件,该文件保存在我的google驱动器中。我尝试在本地安装google驱动器,安装pyreadstat,但仍然显示了错误。
"PyreadstatError:文件/sales.sav不存在!“
我的代码:
# Machine Problem 2
import pandas as pd
import os
#Loading a .Sav file and assigning it to a variable
#We will open and work on "sales.sa
下面是我将.sav转换成一个工作良好的平面文件格式的代码,当我有超过50个文件时,我的问题就会出现。对于如何处理循环中文件夹中的所有可用文件,有什么建议吗?
#load library foreign to read spss
library(foreign)
#set working directory first
setwd("M:\\Files\\Linear Reg")
#read .sav file
data <-read.spss('Computed_Copy.sav', to.data.frame=TRU
我导入了一个.sav SPSS格式的数据集,我收到了一个以前从未见过的错误。
1: In read.spss("C:\\Users\\acer\\Desktop\\X\\X\\PIREDEU\\ees2009_v0.9_20110622.sav", ... :
C:\Users\acer\Desktop\X\X\PIREDEU\ees2009_v0.9_20110622.sav: File contains duplicate label for value 1.1 for variable V200
Error in cat(list(...), file, sep,