1 green 5
2 yellow 6
3 red 3
4 brown 5
5 pink 4
dataframe的一些使用...,比较麻烦,不像pandas直接用df['cols']就可以了
# 需要在filter,select等操作符中才能使用
color_df.select('length').show()
color_df.select...import lit
color_df.withColumn('newCol', lit(0)).show()
# dataframe转json,转完是个rdd
color_df.toJSON()....方法
#如果a中值为空,就用b中的值填补
a[:-2].combine_first(b[2:])
#combine_first函数即对数据打补丁,用df2的数据填充df1中的缺失值
df1.combine_first...lit
df1.withColumn('newCol', lit(0)).show()
13、行的最大最小值
# 测试数据
df=[(1,1000),(2,2000),(3,3000),(4,4000