1.1 spark.read.json() / spark.read.parquet() 或者 spark.read.load(path,format=”parquet/json”)
1.2 和数据库的交互 spark.sql(“”)
123
@pandas_udf("col1 type,col2 type,...,coln type",PandasUDFType.GROUPD_MAP)def f(pdf): pass
df.groupby(col).apply(f).show()
本文分享自 作者个人站点/博客 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!