首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开源推荐 | 新一代云原生大数据管家,构建起稳定、高效、可弹性伸缩的大数据云原生平台

一、项目简介

新一代云原生大数据管家,致力于快速实现部署、管理、监控以及自动化运维大数据云原生平台,旨在帮助用户快速构建起稳定、高效、可弹性伸缩的大数据云原生平台。

二、开源协议

本项目遵循  Apache-2.0 开源协议发布。

三、功能介绍

DataSophon是什么?

《三体》,这部获世界科幻文学最高奖项雨果奖的作品以惊艳的"硬科幻"风被大家所熟知,其作者刘慈欣更是被誉为"单枪匹马将中国科幻提高到世界级水平"。

作为三体中非常重要的角色,智子(Sophon)是将九维的质子进行二维展开,通过电路蚀刻改造成超级计算机后,再转回到微观的十一维来监控人类的一举一动,并利用量子纠缠实现瞬时通信报告给4光年之外的三体文明。说白了智子是三体文明部署在地球的AI实时远程监控和管理平台。

DataSophon也是个类似的管理平台,只不过与智子不同的是,智子的目的是锁死人类的基础科学阻碍人类技术爆炸,而DataSophon是致力于快速实现部署、管理、监控以及自动化运维大数据云原生平台,帮助您快速构建起稳定、高效、可弹性伸缩的大数据云原生平台。

极易部署,用户仅需几步即可完成初始化环境配置,从而快速地完成大规模大数据集群的部署,支持数千个节点规模。

全面兼容开源生态,基于开放式的管理架构,已集成多种常用大数据组件,包括数据集成、数据存储、计算引擎、任务调度、权限管理等大数据处理的各个环节。

兼容复杂环境,极简的架构设计,使其极易适配各种复杂环境,支持arm和x86机器混合部署,支持常用的Linux生态操作系统。

便捷运维,基于生产实践展示用户最关心的监控指标,可方便地对集群、节点和服务进行监控和运维操作,助您大幅提升运维工作效率。

安全可靠,DataSophon支持Kerberos身份认证和数据加密,使用Ranger数据访问控制,从而支持数据加密和权限控制,保证数据安全。

便捷告警,支持告警组和告警指标管理,监控指标全面丰富,用户可根据监控指标自定义告警组和告警指标。

四、演示展示

五、技术选型

产品架构:

技术架构:

集成组件:

各集成组件均进行过兼容性测试,并稳定运行于300+个节点规模的大数据集群,日处理数据量约4000亿条。在海量数据下,各大数据组件调优成本低,平台默认展示用户关心和需要调优的配置。

设计思想:

为设计出轻量级,高性能,高可扩的,可满足国产化环境要求的大数据集群管理平台。需满足以下设计要求:

(1)一次编译,处处运行,项目部署仅依赖java环境,无其他系统环境依赖。

(2)DataSophon工作端占用资源少,不占用大数据计算节点资源。

(3)可扩展性高,可通过配置的方式集成托管第三方组件。

Rpc技术选型:

管理端与工作端通信选择akka框架。选型依据如下:

(1)Actor并发模型,支持协程,比线程小很多,高并发性能高。

(2)非常轻量的事件驱动处理机制(1GB内存可容纳约270万个Actor)。

(3)可以以jar包形式集成到现有框架,简洁易用,无其他依赖。

(4)具备容错机制,允许在Actor出错时进行一些恢复或者重置操作。

(5)消息传递支持exactly once。

(6)相对于netty,学习成本,使用成本更低。

运维监控技术选型:

运维监控技术选择prometheus和Grafana。技术选型依据如下:

(1)强大的数据模型,监控数据以metric{labels}的方式存储在内置的时间序列数据库中。

(2)灵活的查询语句(PromQL)。

(3)监控数据的精细程度高,可以精确到1~5秒的采集程度。

(4)良好的可视化,自带Prometheus UI,可以直接输入PromQL查询监控指标,自动成图,并且支持用grafana进行数据呈现。

(5)支持大量的采集器,其他jmx采集器,使prometheus可轻易获取各大数据组件的服务监控指标。

六、源码地址

本项目代码仓库:

https://gitee.com/datavane/datasophon

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OAmsb81poAuh0H78_Yc5MjAg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券