我正在尝试估计数据块上pyspark 3.0.1中数学分数的比例。某些情况下,我的total_marks是0。所以我写了以下代码 df_oversees2=SQLContext.sql("select A.total_marks=0 then 0 else (maths_marks/total_marks) end as prop_maths from myTable A ")
在使用registerDataFrameAsTable时有问题。根据文档,它似乎在sqlContext类中,因此我自然地尝试了这样的方法:但这导致了这个错误:AttributeError: 'SparkSession' object has no attribute 'registerDataFrameAsTable' from py
我使用sklearn的tfidfvectorizer在进行数据清理和标记化之后,从tweet标记创建了一个稀疏tfidf矩阵。有没有人能帮我一下?--------------------------------------------------------------------------- 372 g = jac(x, *args)
TypeErrorof type