我有一个SQLContext数据框架,它是由几个数字列组成的熊猫数据框架。我想使用pyspark.mllib.stats包进行多元统计分析。统计函数期望向量的RDD。我无法将此数据帧转换为向量的RDD。有办法转换数据帧吗?Statistics.colStats(rdd) df_new = df.applymap(lambda s: dic.get(s) if s in dic else s) #df is a pandasdataframe
我在
经过几次研究,我无法正确地将抓取的数据导出到excel工作表中……from selenium import webdriverfrom selenium.webdriver import ActionChainsfrom time import sleep
df.to_excel('EXTRACTION.xlsx', index = Fa