我试着只运行一个简单的理智检查,看看sc是否存在,并得到下面的错误。
我编译了它的火花和火花1.5 (我使用火花1.5)。我将内存增加到5GB,并将端口更改为8091。:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:68) at org.apache.zeppelin.spark.PySparkInterpreter.ge
我按照的第一部分创建了一个外部配置单元表,并将其指向特定的S3 Bucket。在Hue界面中,我可以在成功创建后浏览数据示例。如果我切换到齐柏林飞艇并运行以下命令:%sql show tables,我可以看到我的表列在default数据库旁边。这个错误是有道理的,但是Hive会让你指定一个S3存储桶,而不是一个实际的S3文件,所以我不知道如何让两者都满意!
请注意,此目录中只有<e
我是Apache Spark (和Scala)的新手,我想在读取csv文件后立即应用一个简单的sql请求,并将其加载到DF上,而不需要创建额外的数据帧或临时视图或表。这是初始请求: SELECT DISTINCT city from citiesAND year IN ("2017", "2018") 这是我在Sc