可以通过以下步骤完成:
pip install psycopg2
pip install pyspark
import psycopg2
from pyspark.sql import SparkSession
conn = psycopg2.connect(database="your_database", user="your_username", password="your_password", host="your_host", port="your_port")
cursor = conn.cursor()
cursor.execute("SELECT * FROM your_table")
rows = cursor.fetchall()
spark = SparkSession.builder.appName("Write to DataFrame").getOrCreate()
df = spark.createDataFrame(rows, cursor.description)
df.write.csv("path_to_save_csv")
以上是将psycopg2查询结果写入pyspark dataframe的基本步骤。根据具体的业务需求,可以进行更多的数据处理和操作。
领取专属 10元无门槛券
手把手带您无忧上云