我有一个关于spark应用程序用法的问题。因此,我希望我们的Spark应用程序作为REST API Server运行,就像Spring Boot应用程序一样,因此它不会是批处理过程,相反,我们将加载应用程序,然后我们希望保持应用程序的活动状态(不调用spark.close()),并通过我们将定义的一些应用程序接口将应用程序用作实时查询引擎。我的目标是将其部署到Databricks。任何建议都是好的。我已经检查过Apa
我正在尝试将我的excel文件导入Azure-DataBricks机器中的PySpark,我必须将其移动到PySpark Dataframe。我无法执行此操作。merge type <class 'pyspark.sql.types.DoubleType'> and <class 'pyspark.sql.types.StringType'>
这里需要你的帮助
order_products_value) FROM global_temp.olist_table GROUP BY customer_state ORDER BY AVG(review_score) DESC"
spark.sql为了将其绘制出来,我使用toPandas将其转换为pandas数据帧,然后执行plot spark.sql(state_grouped).toPandas().plot(kind='barh', figsize正如您在y轴上看到的,索引