使用pandas和statsmodels时拉取变量名称,可以通过以下方法实现:
DataFrame
对象的columns
属性,可以获取数据框中的所有变量名称。例如:import pandas as pd
# 创建一个DataFrame对象
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
# 获取DataFrame对象中的所有变量名称
variable_names = list(df.columns)
print(variable_names)
输出结果:
['A', 'B', 'C']
Formula
对象,可以将数据框中的变量名称作为公式字符串传递给模型。例如:import pandas as pd
import statsmodels.api as sm
# 创建一个DataFrame对象
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
# 使用Formula对象创建模型
formula = 'A ~ B + C'
model = sm.formula.ols(formula, data=df).fit()
# 获取模型中的所有变量名称
variable_names = model.exog_names
print(variable_names)
输出结果:
['Intercept', 'B', 'C']
注意,在使用statsmodels中的Formula
对象时,需要将数据框中的变量名称作为公式字符串传递给模型,这样才能获取到变量名称。
领取专属 10元无门槛券
手把手带您无忧上云