在Spark DataFrame中,可以使用withColumnRenamed
方法来修改连接的列。该方法接受两个参数,第一个参数是要修改的列名,第二个参数是修改后的列名。
以下是修改连接列的示例代码:
from pyspark.sql import SparkSession
# 创建SparkSession
spark = SparkSession.builder.getOrCreate()
# 创建示例DataFrame
data = [("Alice", 25), ("Bob", 30), ("Charlie", 35)]
df = spark.createDataFrame(data, ["name", "age"])
# 修改连接列
df = df.withColumnRenamed("name", "new_name")
# 显示修改后的DataFrame
df.show()
输出结果为:
+---------+---+
|new_name |age|
+---------+---+
|Alice |25 |
|Bob |30 |
|Charlie |35 |
+---------+---+
在上述示例中,我们使用withColumnRenamed
方法将原始的"name"列修改为"new_name"列。
领取专属 10元无门槛券
手把手带您无忧上云