本篇文章进对 RDD 和 DataSet 进行对比和总结。 当然因为随笔,所以想到哪写到哪... 哎~,最近变懒了,都不想动脑子了!!!
等优点,当然这些优点都是对于程序员来说的....
这里扯点有的没的,感觉现在编程写代码真的比几年前要简单太多了, 很多东西慢慢都不需要自己去造了,轮子都给你,你转的起来就可以了。 这也导致,很多程序员其实都在慢慢退化,因为不用思考太多, 就能把工作做好了,或者说只要思考下,有没有轮子有没有轮子... 然后就发现一切都有前人在铺路.... 我们需要做的就是 CV 操作,就能实现以前想都不敢想的功能, 这到底是好呢?还是不好呢? 也许仁者见仁智者见智,不一样的角度,可能都有不一样的答案吧!!! 好了,我们继续。
Compare
方法了,
而是直接基于字节码排序,这样就省略掉了一次 序列化 和 反序列化的 开销。以上这些我想,已经基本可以让你迫不及待的开始将RDD 迁移到 DS 上来吧。 当然,DS也有一些不太友好的地方:
哎~~,想想也是泪,越来越感觉 大数据处理将不再是程序员的专利了!!!