我正在尝试弄清楚如何针对Cassandra数据库测试Spark SQL查询--有点像您在SQL Server Management Studio中所做的那样。scala > var query = csc.sql("select * from users");特别是对于更长的查询这似乎是一种非常低效的方式来测试您的查询是否正确,以及您将获得哪些数据。另一个问题是,当您的查询错误时,您将返回一条长达一英里的错误
问题:select * from table 1 where table1.point is within 50km of any pointin table2.point
我使用Spark-SQL和GeoMesa & Accumulo来实现同样的功能。上面的查询是某种left semi join,但我不确定如何使用Spark-SQL实现它,因为就我所读到的子查询而言,在where子句中不能使用子查询。