,可以使用Python的字符串拼接和eval函数来实现。
首先,我们需要定义一个空的字典来存储动态创建的dataframe,并定义一个列表来存储动态创建的dataframe的名称。
dataframes = {}
df_names = []
然后,在for循环中,我们可以使用字符串拼接来创建动态的dataframe名称,并将其添加到df_names列表中。
for i in range(5):
df_name = "df_" + str(i)
df_names.append(df_name)
接下来,我们可以使用eval函数来执行字符串拼接后的代码,并将结果赋值给动态创建的dataframe名称。
for df_name in df_names:
eval(df_name + " = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])")
dataframes[df_name] = eval(df_name)
最后,我们可以通过访问dataframes字典中的动态创建的dataframe来使用它们。
for df_name in df_names:
df = dataframes[df_name]
df.show()
这样,我们就可以在for循环中动态创建并命名pyspark dataframe了。
关于pyspark dataframe的更多信息,您可以参考腾讯云的产品介绍链接地址:腾讯云PySpark。
领取专属 10元无门槛券
手把手带您无忧上云