如何从PySpark中的多个列创建字典列表，其中key是列名，value是该列的值？

在PySpark中，可以使用select和collect方法来从多个列创建字典列表，其中字典的key是列名，value是该列的值。

下面是一个示例代码：

from pyspark.sql import SparkSession

# 创建SparkSession
spark = SparkSession.builder.getOrCreate()

# 创建一个示例DataFrame
data = [("Alice", 25, "Female"), ("Bob", 30, "Male"), ("Charlie", 35, "Male")]
df = spark.createDataFrame(data, ["name", "age", "gender"])

# 从多个列创建字典列表
dict_list = df.select(*[df[col] for col in df.columns]).rdd.map(lambda row: row.asDict()).collect()

# 打印字典列表
for d in dict_list:
    print(d)

运行以上代码，将会输出以下结果：

{'name': 'Alice', 'age': 25, 'gender': 'Female'}
{'name': 'Bob', 'age': 30, 'gender': 'Male'}
{'name': 'Charlie', 'age': 35, 'gender': 'Male'}

在这个示例中，我们首先创建了一个SparkSession对象，然后使用createDataFrame方法创建了一个DataFrame对象。接下来，我们使用select方法选择了所有的列，并使用rdd.map方法将每一行转换为字典形式。最后，使用collect方法将所有的字典收集到一个列表中。

这种方法可以适用于任意数量的列，并且可以处理不同类型的列。

如何从PySpark中的多个列创建字典列表，其中key是列名，value是该列的值？

、、、、

40 2 c 70 80 从这个数据帧df中，我希望在一行中收集每个items的所有user_id及其属性item_paramX，因此输出将是： user_id | values -------------------------------item_param2': 60}}, {'c': {'item_param1': 70,

浏览 2提问于2021-03-25得票数 1

回答已采纳

1回答

动态创建spark中的多列

、、、、

我有字典里有这样的信息， dict_segs = {'key1' : {'a' : {'col1' : 'value1', 'col2' : 'value2', 'col3': 'value3'},'value1', 'col4' : 'value</em

浏览 4提问于2017-09-11得票数 1

回答已采纳

1回答

在Python Vaex库中，如何将列的值替换为允许的列自定义值

、

我有一个字典，其中键-值对列name和value作为这些列中允许的值的列表如何将字典列表中未出现的值替换为“0” FinalCat_是列名列表CombinedCat是Vaex df AllowedCatColValuesFast是

浏览 33提问于2021-04-28得票数 0

1回答

机器人框架中读Csv作为字典的论证

、、、、

我使用的是在Python3.7.5上运行的RIDE 1.7.3.1。我正在执行从frpm python 27到python 37的迁移过程。在python 27中，我使用关键词read文件关联读取csv文件作为词典。例如，如果我的csv文件是1,Alice,20,62,120.63,Bob,17,68,120.0 我想要像下面这样的输出

浏览 1提问于2019-12-03得票数 0

1回答

如何从字符串创建有意义的列值对列表？

、、、

我试图使用Python从输入字符串中对列和值(column=value)进行有意义的分类。在第一个场景中，键是列名。该值表示在input_string中找到的键的最低索引。以下是列名字典： dict_columns = {'status': 4, 'product subtype

浏览 1提问于2017-04-25得票数 1

回答已采纳

1回答

如何从字典创建pandas数据帧，其中列名作为键，值作为行，其中值是二维数组

、、

我想知道如何从字典中创建熊猫数据帧。所以关于字典d，每个键的值的大小是(200,200)， d[key].shape (200, 200) 总共有59把钥匙。我想要的是，键应该是列名，对于每个键作为列，dkey可以是该列的第一行，dkey可以是第二行，依此类推。因此，在每一

浏览 8提问于2021-10-28得票数 0

回答已采纳

4回答

使用值的变量#将键:值对写入以制表符分隔的文件

、、、

初学者问题:我有一个字典，其中的值是(a variable # of)字符串的列表。最后，我想将每个字典条目写到一个以制表符分隔的行，键作为列1，值列表中的各个项作为列2-n。我使用以下代码生成了一个输出文件，其中键作为第一列，值列表作为第二列</e

浏览 2提问于2012-04-03得票数 4

回答已采纳

1回答

在PySpark中用多个字典解压缩字符串列

、、、、

在Databricks中，使用PySpark，我正在处理一个具有以下列的DataFrame，其中每一行都是一个具有多个字典的列表：我想打开/平放这一列，以便为每个字典值都有一个单独的列但是，问题是该列的数据类型是字符串。我怎样才能打开这个专栏？作为

浏览 3提问于2022-09-20得票数 1

1回答

哪种方法更适合在sqlite数据库中存储键值对？

、、、

我正在创建一个聊天机器人，它将有自己的“记忆”。它将用户的输入保存在键-值对中，稍后访问该内存以查看如何构造响应。数据库基本上就像一个字典，随着机器人接收输入而增长。第一种方法是简单地生成两列，并将多个值添加到"Value“列。value列存储多个字符串。编辑:关于机器人将如

浏览 0提问于2016-03-10得票数 0

1回答

模型中的多个字典DropDownLists

、、

我试图为用户动态创建多个下拉列表(ASP.Net MVC项目)，以映射从CSV导入数据的列。我从CSV文件中获取列的列表，并将它们放在SelectList中。这些是用户为每个目的地选择的SourceColumns。如果我硬编码目标索引，它可以正常工作。我的意思是，如果我为每个目标索引添加一个整数属性。但是，我

浏览 3提问于2016-01-03得票数 0

回答已采纳

2回答

在pySpark中按条件分割数据

、、、

我有一个dataframe值为false、true或null。我想创建两个dataframes，1)只使用True列名，2)只使用假列名。我最初的想法是创建两个dataframes (因为它们稍后将被附加到一个更大的数据集中)，或者我还考虑将适当的列名转换为一个列表，然后将列表名称转换为列名。我是pySpark新手，我想知道<e

浏览 3提问于2020-05-07得票数 1

回答已采纳

1回答

、

我有一个PySpark dataframe，它有一个列，前两行如下所示。一个字典的列表。然而，PySpark似乎将它们解释为字符串。Color'}]我的目标

浏览 5提问于2022-05-10得票数 0

1回答

将动态DataTable转换为List<Dictionary<string，string>>

、、

我想要一种优雅的方式来获得像这样的DataTable：并将其转化为：列表中的每个字典对应于一行。字典包含行的值，其中键是列名，值是列值。 <

浏览 9提问于2013-11-13得票数 9

回答已采纳

1回答

Jinja2字典列表进入HTML？

、、

因此，我试图使用Jinja2从字典列表(如Flask语句返回的那样)创建一个HTML。<table style="width:100%"> {% for key, value in d

浏览 3提问于2017-03-17得票数 5

回答已采纳

1回答

如何从dataframe创建字典，其中键是列名，值是列下的值数？

、、、、

我想从数据框架中创建一个字典，其中我将有163个键，其中的值是它们中的条目数(即非空条目的数目)，我尝试使用to_dict()操作，但是无法将值作为每列下条目的计数 dict1 = data-frame.to_dict

浏览 2提问于2022-10-03得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何从PySpark中的多个列创建字典列表，其中key是列名，value是该列的值？

相关·内容

如何从PySpark中的多个列创建字典列表，其中key是列名，value是该列的值？

动态创建spark中的多列

在Python Vaex库中，如何将列的值替换为允许的列自定义值

机器人框架中读Csv作为字典的论证

如何从字符串创建有意义的列值对列表？

如何从字典创建pandas数据帧，其中列名作为键，值作为行，其中值是二维数组

使用值的变量#将键:值对写入以制表符分隔的文件

在PySpark中用多个字典解压缩字符串列

哪种方法更适合在sqlite数据库中存储键值对？

模型中的多个字典DropDownLists

在pySpark中按条件分割数据

迭代数据，并将字典列表转换为以列作为键python的新字典。

如何从SQLAlchemy行构建字典，将单元格数据用作键和值而不是列名？

从字典创建数据时发生的StopIteration错误

从上到下填充DataGrid

Linq to sql多列

从PySpark数据字典列表中提取密钥

将动态DataTable转换为List<Dictionary<string，string>>

Jinja2字典列表进入HTML？

如何从dataframe创建字典，其中键是列名，值是列下的值数？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐