曹汇杰 (红花生)
大数据技术和处理系统需要覆盖的面有很多 他需要开源社区对其的进一步发展和采用 有更多的人更方便的接触到他 可以使他得到更多创新和改进 又因为他覆盖的面宽 在不断地创新和改进中渐渐发展出了属于自己的生态系统
莫根杰 (寞)
大数据处理系统如hadoop和spark走开源路线有助于更多的人参与进来,进行技术的开发和发展。这意味着相关社区活跃程度更浓,应用范围也会逐渐扩大,其生态也自然而然逐渐形成。
刘博 (yan huo)
随着海量的数据的不断增长,传统的商业方案(数据仓库等)不能解决问题.单独开发大数据处理系统费时费力,而开源,既能降低开发成本,加速创新,又便于使用者做出快速的,有针对性的改进.因为大数据应用广泛,各大企业也加大了对开源社区的赞助和智力投入,经过不断开发和完善,大数据处理系统逐渐形成了生态.
牛悦安 (牛悦安)
开源更有助于提高项目的质量:每一个使用此开源项目的都会帮你检测bug,提交补丁,相当于帮你开发项目;对于大数据处理系统这种庞大的项目,开源这一优势得到最大的发挥,使大数据处理系统有更大格局。
曹云昀 (Moe)
开源,开放,其他工程师都可以去做,都可以运用,从而利于大数据软件,技术平台的发展创新。 由于大数据要处理大量、非结构化的数据,所以各个处理环节都要采用分布式并行处理的方式。所以要有共享性,并且能被高效的访问。开源不仅驱动着大数据技术的创新演进,也推动着大数据产业的不断进步,所以逐渐形成了繁荣的大数据应用生态。
张润权 (张润权)
开源更有利于知识的分享和创新,让软件有更大的发展空间。开源让软件开发获得更广泛的支持。
段连杰 (慎重)
大数据处理系统走开源的路线有很多好处:针对大数据的开源代码平台具有高灵活性,低成本,高质量的优势,在大数据分析平台的构建中,开源软件扮演着极其重要的角色。大数据需要大量的计算解决资源,配置大数据环境也是一项复杂的任务,要以低成本和可扩展的方式处理大数据,这就需要对整个IT架构进行重建,开发先进的软件平台和算法,而开源软件能提供一个能很好地支持大数据部署的平台。
王子玥 (bubble)
大数据处理系统需要快速发展才能满足需求,开源能加速创新,集结更多智慧,提高可用性。 不同场景,不同需求情况下要运用不同工具处理大数据。而很多技术都是为了解决大数据处理过程中不断出现的新问题而产生的。这些工具彼此功能又有交叉,于是便形成了一种生态。
徐敏 (安生)
大数据系统创新之所以如此迅猛地发展,开源在传播中起到了至关重要的作用,因为开源非常符合罗杰斯所定义的影响创新扩散速度的五个因素: 1. 相对优势:开源大数据产品基本都是基于廉价商用硬件且免费,相对为定制化硬件开发的传统企业级数据平台,性价比优势是相当明显的,同时也不用担心供应商锁定(Vendor Lock In)。 2. 兼容性:开源大数据产品覆盖了数据收集、存储、分析等全部环节,并且有多款产品支持SQL接口,使得开发者体验有了延续;同时,NoSQL成熟之后的NewSQL理性回归,更是向开发者示好。 3. 复杂性:通过SQL on Hadoop等应用降低了门槛,现有开发技能得以留存。基于MPP架构的OLAP系统,本身就提供了兼容OLTP的接口。此外,社区演化开源产品速度很快,不停有新的特性来降低复杂性。 4. 可试性:免费试用满意了再付钱,分阶段采用的开源大数据产品比起那些一锤子的买卖要更有亲和力。开源产品在这点上做得不能更好了,连源代码都给你看了,你还在等什么呢 J 5. 可观察性:创新的结果越容易观察到,越容易引起关注和讨论,以至采纳者越容易接受它。当知名互联网公司都使用开源大数据产品运营日常业务,没有什么比这个更具有说服力。 参与开源的人越来越多,也就逐渐形成了一个体系,进而形成了一个生态。
金英豪
开源已经成为了现代计算机技术发展的一个趋势,能更快发现软件产品的优劣,bug等,对于大数据处理系统来说,开源意味着有更多的人可以从底层学习、调试、使用这些系统,更多层次的用户能带来更多方面的数据,这与大数据处理的关键“大”不谋而合,也有助于软件系统本身和数据整个行业的发展
毛冬妮 (冬洛克福尔毛斯)
开源意味着免费和自由地进行二次开发,它以较低成本、快速采集、处理和分析技术,从大数据中提取价值。开源让越来越多的项目可以直接采用大数据技术,因此Hadoop增长速度很快。而且由于其低成本和能够快速改进的优势,很多企业会继续扩大该技术应用,使得Hadoop会更加普及。
印张悦 (Polaris)
Hadoop和Spark等大数据处理系统走开源路线显然是明智之举,开源的意义是为了挖掘新的产业模式,软件最初就是开源免费的,怀抱着这种美好的不带商业气息的信念,才有了Linux和GNU那么出色的系统和软件。随着时代的发展,开源始终是一些开发者的理想,开源也能更好的营造生态。腾讯早期一家独大,对于有相同产品方向的公司并不友好,直到与360的争端爆发之后,才意识到营造产品生态的重要性,所以一个领域的生态非常重要,而开源正是一种非常高效的营造生态,营造社区的方式。
刘颖凡 (西山有禾暖)
首先,大数据处理系统的开源将源代码公布出来,开放给更多人一起使用一起研发,共同寻找漏洞,推动整个项目的进程,同时也可以提高安全性能。 其次,大数据具有多维度、完备性、关联性、不确定性的特征,即数据种类繁多数量庞大,实时性强且真假存疑,基于以上特性,我们提出以下需要:1.存储大量数据 2.快速的处理大量数据 3.从大量数据中进行分析;因此,形成一个集“储存+计算+管理”的分布式数据管理生态系统也就愈发重要,可以利用集群的力量,提高数据管理的效率和容错性,以此建立一个更加稳固的数据体系。
魏如蓝(weirulan)
针对企业的开源解决方案通常会围绕着它们诞生蓬勃发展的社区,受到共同驱动力的约束,解决方案也得以得到支持和改进,企业和社区也都会从中受益,更快、更好地引入新的概念和功能,更高效率。开源代码让大家可以充分了解代码库,相比之下,保密产生的专有代码则可能会带来意想不到的限制和其他不受欢迎的“惊喜”。因为有许多人在监督着,开源代码的可靠性往往也是更胜一筹。有全球范围社区支持的代码库,而不是一个公司内的一个团队。 与可靠性一样,开源软件的代码通常也更加安全,因为它经由社区进行了更为彻底的审查和检查。并且开源软件具有长期的可行性,比专有软件的寿命更长。由于有支持力强的社区在不断引进创新,开源软件始终处于技术发展的前列,并在企业未来发展的同时满足企业的需求。
领取专属 10元无门槛券
私享最新 技术干货