首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >PySpark -迭代数据框的行

PySpark -迭代数据框的行
EN

Stack Overflow用户
提问于 2018-07-03 10:28:45
回答 1查看 9.1K关注 0票数 1

我需要迭代pyspark.sql.dataframe.DataFrame.DataFrame的行。

我以前在pandas中用iterrows()函数做过,但我需要在不使用pandas的情况下为pyspark找到类似的东西。

如果我执行for row in myDF:,它将迭代columns.DataFrame

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-07-03 13:07:26

您可以使用select方法通过用户定义的函数对数据帧进行操作,如下所示:

代码语言:javascript
运行
AI代码解释
复制
    columns = header.columns
    my_udf = F.udf(lambda data: "do what ever you want here " , StringType())
    myDF.select(*[my_udf(col(c)) for c in columns])

然后,在select中,您可以选择要对每一列执行的操作。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51152310

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文