我有一个具有两个不同ids的项目的DataFrame。id1和id2,其中id2确实是独一无二的,可以有多个id2对应一个id1。项目功能特定于id2s。B red small
3 222 349 B blue small 我想要按id1进行分组,并在列中获得一致的值,只有当组中的所有行在该列中都有相同的值时,否则就是NaN。因此,上面示例中的预
在spark.sql查询中注册和使用pyspark version 3.1.2内置函数的正确方式是什么? 下面是一个创建pyspark DataFrame对象并在纯SQL中运行简单查询的最小示例。For column literals, use 'lit', 'array', 'struct' or 'create_map' function...的pyspark内置函数运行相同查询的代码出现错误import pand