可以通过以下几种方式实现:
result = df.collect()
for row in result:
print(row)
result = df.toPandas()
for index, row in result.iterrows():
print(row)
def process_row(row):
print(row)
df.foreach(process_row)
new_df = df.select("column_name")
result = new_df.collect()
for row in result:
print(row)
result = df.head(5)
for row in result:
print(row)
以上是获取pyspark dataframe中的值的几种常用方法。根据具体的需求和数据规模,选择合适的方法进行操作。
领取专属 10元无门槛券
手把手带您无忧上云