我可以看到,shell在创建DataFrame对象时识别模式,但是如果我对数据执行任何操作,它总是在尝试实例化NoClassDefFoundError时抛出AvroWrapper。我尝试将avro-mapred-1.8.0.jar添加到集群的$HDFS_USER/lib目录中,甚至在启动shell时使用-jar选项将其包括在内。这两个选项都不起作用。如有任何建议,将不胜感激。下面是示例代码:scala> im
我的spark应用程序无法在AWS EMR集群上运行。我注意到这是因为有些类是从EMR设置的路径加载的,而不是从应用程序jar加载的。<init>(Ljava/lang/String;Lorg/apache/avro/Schema;Ljava/lang/String;Ljava/lang/Object;)V
at co