Hadoop2.2 (测试环境,不过个人感觉1.X和2.X的自定义类型应该是一致的,没做过对比)
自定义类部分代码如下所示:
@Override public void write(DataOutput out) throws IOException { log.info("in write()*************************\nvalue:"+this.value+"\ndir:"+this.parentDirName); value.write(out); parentDirName.write(out); }
@Override public void readFields(DataInput in) throws IOException { log.info("in read()*******************\nvalue:"+this.value+"\ndir:"+this.parentDirName); value.readFields(in); parentDirName.readFields(in); }
在使用这个自定义类作为value的时候出现下面的错误:
这里可以看到,在write方法里面是有值的,但是在read方法的时候出现的值是null。几经排查,发现是定义的时候有个地方没有注意。
在构造方法中,我第一次使用的是下面的代码,第二次是把其中的注释地方去掉了,然后就没有出现NullPointerException了。
public JoinValueWritable(){ // this(new Text(),new Text()); } public JoinValueWritable(Text value ,Text parentDirName){ this.value=value; this.parentDirName=parentDirName; }
这里自定义类应该是要调用一个默认的无参的构造方法,如果里面什么都没有,那么就会出现错误。所以里面就需要加上一个有参数构造方法或者写上set方法也行。