首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

架构师之路:星环大数据架构师的培训心得

2020年3月,有幸参与了星环科技大数据架构师的培训认证。在范颖捷老师的授课中,感慨颇多。今天我根据学习到的部分知识谈谈自己的心得体会。...在谈培训心得之前,我得先向大家介绍一下向我提供星环大数据架构师的培训认证的 [星环科技公司] ?...图片来源:星环科技培训官网 架构师 言归正传,可能很多人知道码农是码代码的程序员,但是对架构师的概念确实一头雾水。...图片来源:星环科技培训官网 培训流程 整个星环大数据架构师的培训认证流程以线上直播的形式,结合实践案例,由浅入深地向我们展示了星环科技针对不同需求而推出的行业解决方案。...星环科技大数据架构师的培训除了教会我大数据架构师的知识,整个培训让我明白了三件事情: 架构师是干嘛的? 大数据项目如何根据需求做好解决方案? 作为架构师应该如何推进项目以及把控风险?

1.2K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    架构师 | 数据仓库建设灵魂10问

    笔者先后在外企,互联网,金融行业工作,从最初的ODS,DM架构到后面ODS,DWD,DWS,ADS架构都有较深的理解和应用,甚至在相当长的时间内,数仓设计一直作为一个常规的面试题目,来考核各层级的数仓开发和架构师...这篇文章主要针对数仓设计来谈谈我的看法,因为不同的规模的公司对数仓建设的目的有差异,这里从架构师角度仅讨论中大型企业的数仓架构建设。本文主要以一问一答式来展开讨论。 1.一般用数仓来做什么?...反过来讲,如果公司系统较为单纯,数据量比较小,传统关系型数据库以及完全可以满足数据检索和分析的需求,就不需要花成本来构建数仓。...首先历史数据备份,尤其是金融机构,客户的历史若干年的记录都需要保留,而如果放在源业务系统,数据量过大,此外很多历史数据是冷数据,不常使用。...现在可选择的大数据同步技术也比较多,如datax,canal,kafka等。因为这一层的目的主要是把源系统的数据基本原样(有些数据敏感等级高不同步)的同步到大数据平台,因此比较容易进行方案的统一。

    52240

    架构师指南:现代数据湖参考架构

    现代数据湖将数据湖的灵活性与数据仓库的结构相结合,同时为两者提供可扩展性和性能。...旨在最大化其数据资产的企业正在采用可扩展、灵活且统一的数据存储和分析方法。这种趋势是由负责构建与不断变化的业务需求相一致的基础架构的企业架构师推动的。...但现代数据湖不仅仅是一个花哨的数据仓库,因为它还包含一个用于非结构化数据数据湖。OTF 还提供与数据湖中外部数据的集成,这允许在需要时将外部数据用作 SQL 表。...可以在摄取层中进行简单和复杂的数据转换。 数据源:数据源层在技术上不是现代数据湖解决方案的一部分,但本文中包含它,因为构建良好的现代数据湖必须支持具有不同数据发送功能的各种数据源。...如果数据湖用作原始数据的着陆区,那么此功能以及数据仓库的 SQL 功能可用于在将原始数据插入数据仓库之前对其进行转换。

    18510

    架构师的AIML数据湖参考架构指南

    构建一个完整的数据基础设施是可能的,该基础设施支持组织的所有需求——数据分析、数据科学、判别式 AI 和生成式 AI。 现代数据湖 让我们从定义一个现代数据湖开始,因为这将作为我们参考架构的基础。...现代数据湖一半是数据仓库,一半是数据湖,并且对所有内容都使用对象存储。将对象存储用于数据湖非常有意义,因为对象存储适用于非结构化数据,而数据湖就是用来存储非结构化数据的。...非结构化数据通常存储在业界称为数据湖中。 将对象存储用作数据湖和数据仓库的基础,可以得到一个能够容纳所有数据的解决方案。结构化存储驻留在基于 OTF 的数据仓库中,非结构化存储驻留在数据湖中。...让我们看看现代数据湖中可用于存储和处理判别式 AI 所需数据的选项。 非结构化数据的存储 非结构化数据将驻留在数据湖中,在那里可用于训练和测试模型。...顾名思义,此功能不会复制数据。相反,它使用用于实现数据仓库的开放表格式的元数据层来创建数据唯一副本的外观。

    18910

    架构师之路一-架构师入门指引

    导读:本系列文章教你怎么样成为一名架构师,而本篇文章则带你先认识一下什么是架构师架构师的工作是什么?...为什么需要架构师 为什么需要架构师或者说架构师能解决什么样的问题,我们不妨先从两个不同的视角来看一下。...以用户登录为例,从架构设计的角度可能就只是一个用户服务组件,而从概要设计的角度可能就是前端页面、用户接口、数据库等一系列功能的设计。...概要设计和详细设计阶段的职责(与开发组长一起完成概要设计) 与开发组长一同确定详细设计的范围,指导中级开发人员完成必要的详细设计 初期指导,说明架构设计意图、详细设计注意事项 设计检查与评审,确保详细设计符合架构设计要求 参与数据库设计...,确保数据库设计符合架构设计要求,主要考虑性能、数据量等问题 参加界面设计评审 功能清单整理,根据系统用例和架构设计中的组件定义推导出功能清单 接口定义,包括组件间的通信机制定义和功能模块间的接口定义

    3.1K42

    测开架构师谈大数据——大数据层级的测试重点

    在目前较流行的大数据5V标准之下,决定了大数据测试所应对的业务和常规业务测试存在一定的差异性和难度,下面我们就来看看基于大数据层级的一些测试关注点。...大数据层级: 2 数据收集层测试重点 这一层是处于应用最底层,通常情况下大多数大数据类型的产品会从多数据源收集数据并进行一定的预处理然后存库(通常存放在HDFS中),该层级主要可能运用到的大数据技术Hadoop...数据的完整性(保证采集的数据不缺失) 2. 数据的一致性)(保证采集的数据和原始数据保持一致) 3. 数据合理性校验(如样本存在年龄=1000等) 4. Kafka通道的稳定性 5....满足数据加载性能的基线要求 3 数据存储层测试重点 这一层主要作用是用于存储采集到的数据或者计算分析完的数据,主要采用Hadoop技术栈中的HDFS、Hbase、Hive等 测试重点: 1....数据分析层测试重点 数据分析层主要作用在于通过清洗后的数据形成对应的数据产品,主要的在于报表的形成、 数据指标的计算、等级评估等。

    26810

    从小白到大数据架构师的学习历程

    在大数据数据科学领域,Python几乎是万能的,任何集群架构软件都支持Python,Python也有很丰富的数据科学库,所以Python不得不学。...Hbase:这是Hadoop生态体系中的NOSQL数据库,他的数据是按照key和value的形式存储的并且key是唯一的,所以它能用来做数据的排重,它与MYSQL相比能存储的数据量大很多。...数据多了同样也需要排队处理,这样与你协作的其它同学不会叫起来,你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来,你别怪他因为他不是搞大数据的,你可以跟他讲我把数据放在队列里你使用的时候一个个拿...上市互联网公司大数据专家,《白话大数据与机器学习》作者,高老师半小时的精彩分享,助你更好的了解大数据人工智能。...多年专注于数据库、大数据数据挖掘、机器学习、人工智能等相关领域的研究。擅长传统机器学习、深度学习、数据建模、关系型数据库应用以及大数据框架等的应用。

    2.2K70

    「企业架构」企业架构师vs解决方案架构师vs领域架构师

    企业架构在概念上可以划分为不同的架构层,包括业务架构和IT架构(数据、应用程序和技术架构)。 然后,解决方案体系结构接受一个问题,并提出构建块来解决它。...但是,人们可能会混淆这些角色和职责,例如,企业架构师有时会与解决方案架构师混淆,或者技术架构师与基础设施架构师的角色混淆。这不仅是因为他们的职位听起来相似,而且他们的职责也有部分重叠。...数据架构描述了一个组织的逻辑和物理数据资产和数据管理资源的结构。通过数据分析了解您的客户,使您能够改进和持续改进业务流程。 技术体系结构描述实现业务、数据和应用程序服务所需的软件和硬件。...业务架构师 应用程序架构师 信息架构师 技术架构师 数据架构师 安全架构师 ? 企业架构师vs解决方案架构师vs领域架构师 企业架构师定义需要解决的问题。 解决方案架构师将问题转化为解决方案。...领域架构师负责一个解决方案(例如,业务架构师与企业架构师一起负责业务架构,同样,应用架构师负责应用架构师与另一个领域架构师一起工作) ?

    1.8K41

    数据架构师从入门到精通 学习必看宝典

    还是数学、统计学专业,对数据和数字特别感兴趣。 ? 其实这就是想告诉你的大数据的三个发展方向,平台搭建/优化/运维/监控、大数据开发/ 设计/ 架构、数据分析/挖掘。...先扯一下大数据的4V特征: 数据量大,TB->PB 数据类型繁多,结构化、非结构化文本、日志、视频、图片、地理位置等; 商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来...有的朋友可能不知道数据仓库,数据仓库是逻辑上的概念,底层使用的是数据库,数据仓库中的数据有这两个特点:最全的历史数据(海量)、相对稳定的;所谓相对稳定,指的是数据仓库不同于业务系统数据库,数据经常会被更新...此时,你的”大数据平台”是这样的:那么问题来了,海量数据如何到HDFS上呢? 第三章:把别处的数据搞到Hadoop上 此处也可以叫做数据采集,把各个数据源的数据采集到Hadoop上。...至此,你的大数据平台底层架构已经成型了,其中包括了数据采集、数据存储与计算(离线和实时)、数据同步、任务调度与监控这几大模块。接下来是时候考虑如何更好的对外提供数据了。

    73930

    【企业架构师】12 项企业架构师认证

    EC 委员会认证网络防御架构师 (CNDA) 谷歌专业云架构师 专业云解决方案架构师认证 红帽认证架构师 Salesforce 认证技术架构师 (CTA) The Open Group TOGAF 9...认证 The Open Group 认证架构师 (Open CA) 虚拟化委员会主基础架构架构师认证 AWS 认证解决方案架构师 AWS 认证解决方案架构师考试涵盖根据客户或客户要求构建架构设计解决方案...您需要具备所有计算机、网络、存储和数据库 AWS 服务的实践经验才能通过考试。您不必参加课程即可通过考试,但亚马逊建议您在参加考试之前至少有 6 个月到 2 年的 AWS 使用经验。...费用:200 美元 专业云解决方案架构师认证 由云认证委员会 (CCC) 提供的专业云解决方案架构师认证专为技术、应用程序、系统和企业架构师以及云战略顾问和高级开发人员而设计。...您首先必须获得认证应用程序架构师或认证系统架构师认证,然后才能参加 CTA 考试。要获得 Salesforce CTA 认证,您还必须通过技术架构师审查委员会考试。

    2K20

    什么是架构师?一 什么是架构师架构师的职责三 架构师的误区四 架构师的基本素质五 架构师需要掌握的技术体系

    实际工作中,我们也经常会见到另一种比较简单的分类方式,把架构师分为软件架构师和系统架构师。...软件架构师基本上是TSA+IA,这也是程序员最容易突破,最可能走上的一条道路,比如JAVA架构师、DotNet架构师、LAPM架构师等等,我后面所讲的内容都是与软件架构师的相关的话题。...数据库采用MSSql、Oracle还是Mysql?需要不需要采用MVC或者Spring等轻量级的框架?前端采用富客户端还是瘦客户端方式?类似的工作,都需要在这个阶段提出,并进行评估。...一:常见模式与工具 学习Java技术体系,设计模式,流行的框架与组件是必不可少的: 常见的设计模式,编码必备 Spring5,做应用必不可少的最新框架 MyBatis,玩数据库必不可少的组件 ?...二:分布式架构 高并发,高可用,海量数据,没有分布式的架构知识肯定是玩不转的: ?

    2.3K20

    「首席架构师推荐」精选数据分析软件列表

    数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。...在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。...数据分析是数学与计算机科学相结合的产物。...在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。...定性数据分析又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。 精选数据分析软件列表 ? ? ?

    56610

    数据架构Lambda-架构师(六十九)

    今 日 一 码 随着信息时代技术的发展,数据量的快速增加逐渐飙升到了惊人的数量级别。并且数据的采集与处理技术还在更新加快。...大数据中,结构化占比百分之15左右,其余百分之85都是非结构化数据,他们大量存在于社交网络、互联网和电子商务等领域。...(1)批处理层(Batch Layer):存储数据集,预先计算查询函数,并构建查询对应的view。Batch Layer适合批量处理离线数据。...该层主要负责主数据集,主数据集有以下三个属性: (1)数据是原始的 (2)数据是不可变的 (3)数据永远真实的 2、加速层 它存储实时视图并传入数据流,以便更新这些视图。 他们的区别是什么呢?...(1)speed layer处理数据是增量数据,batch layer是全体数据

    45230

    业务架构师、系统架构师、软件架构师:职责、技能要求及对比分析

    在企业的不同技术层次,业务架构师、系统架构师和软件架构师各自扮演着关键角色。本文将详细探讨这三个角色的职责、技能要求,并进行对比分析。 1....业务架构师 1.1 职责 1.1.1 定义业务战略 业务架构师需要了解公司的整体战略,将其转化为业务架构,支持公司目标的实现。...对比分析 4.1 业务架构师 vs 系统架构师 职责范围:业务架构师聚焦业务层面;系统架构师则着重技术实现。 技能侧重:业务架构师需强调业务分析和战略思考;系统架构师则更注重技术广度和系统思维。...4.2 系统架构师 vs 软件架构师 职责范围:系统架构师涉及整体技术架构;软件架构师专注软件内部结构。 技能侧重:系统架构师需对多个领域有一定了解;软件架构师则需要深入的编程技能和设计能力。...4.3 业务架构师 vs 软件架构师 职责范围:业务架构师着重战略和业务层面;软件架构师关注软件设计和实现。 技能侧重:业务架构师需强调沟通和协调能力;软件架构师则更注重技术深度。

    2.7K10

    架构师之路

    又快接近年底了,正好今天有空,想写一下一个合格的架构师需要知道哪些东西。下面我整理了一下,重看一边: 1.计算机的基础知识整理一遍。...围绕这三点重新看一下,肯定收获不小,下面我整理一下需要用的一些技术点: 数据结构队列 集合 链表、数组 字典、关联数组 栈 树二叉树 完全二叉树 平衡二叉树 二叉查找树(BST) 红黑树 B,B+,B*...IP HTTP HTTP2.0 HTTPS 网络模型Epoll Java NIO kqueue 连接和短连接 框架 零拷贝(Zero-copy) 序列化(二进制协议)Hessian Protobuf 数据库基础理论数据库设计的三大范式...Spark 安全web 安全XSS CSRF SQL 注入 Hash Dos 脚本注入 漏洞扫描工具 验证码 DDoS 防范 用户隐私信息保护 序列化漏洞 加密解密对称加密 哈希算法 非对称加密 服务器安全 数据安全数据备份...代码规范 代码 Review RUP 看板管理 SCRUM 敏捷开发 极限编程(XP) 结对编程 PDCA 循环质量管理 FMEA管理模式 通用业务术语 技术趋势 政策、法规法律严格遵守刑法253法条 架构师素质

    75920

    「首席架构师看敏捷数据数据库重构:适应业务快速变化

    我的经验是,一种关键技术是数据库重构。 目录 重构 数据库重构 为什么数据库重构?...保留语义 什么数据库重构不是 为什么数据库重构很难 如何重构数据库 第1步:从您的开发沙箱开始 第2步:在集成沙箱中实施 第3步:安装到生产中 在您的组织内采用数据库重构 数据库重构最佳实践 现实世界中的数据库重构...您应该对数据库重构感兴趣的原因有两个: 安全地修复现有的旧数据库。底线是遗留数据库不会自行修复,从技术角度来看,数据库重构是一种安全,简单的方法,可以随着时间的推移改善数据数据库的质量。...在图2的复杂情况下,Agile DBA需要了解组织内的整体技术基础架构以及其他应用程序如何与数据库耦合。这是他们需要通过与企业架构师,企业管理员,应用程序开发人员甚至其他敏捷DBA合作来建立的知识。...4.1.6迁移数据 许多重构要求您将旧版本的架构迁移或复制数据到新架构。您的数据迁移日志包含数据操作语言(DML),用于在整个项目过程中重新格式化或清理源数据

    98120

    JAVA架构师面试题,如何成为架构师

    HTTP连接池实现原理 数据库连接池实现原理 数据库的实现原理 技术框架 看过哪些开源框架的源码 为什么要用Redis,Redis有哪些优缺点?Redis如何实现扩容?...短期,长期目标是什么 团队的规划是什么 能介绍下从工作到现在自己的成长在那里 JAVA架构师的水准: 既然java架构师,首先你要是一个高级java攻城尸,熟练使用各种框架,并知道它们实现的原理。...数据库的设计能力,mysql必备,最基础的数据库工具,免费好用,对它基本的参数优化,慢查询日志分析,主从复制的配置,至少要成为半个mysql dba。其他nosql数据库如mongodb。...想成为架构师不是懂了一大堆技术就可以了,这些是解决问题的基础、是工具,不懂这些怎么去提解决方案呢?这是成为架构师的必要条件。...架构师还要针对业务特点、系统的性能要求提出能解决问题成本最低的设计方案才合格,人家一个几百人用户的系统,访问量不大,数据量小,你给人家上集群、上分布式存储、上高端服务器,为了架构而架构,这是最扯淡的,架构师的作用就是第一满足业务需求

    3.4K121

    架构师的AI数据栈互操作性指南

    随着 人工智能 (AI) 和机器学习在各行各业的不断扩展,数据架构师面临着一个关键挑战:在日益碎片化和专有的生态系统中确保互操作性。...现代 AI 数据栈 必须灵活、成本效益高且面向未来,同时避免令人头疼的供应商锁定,这种锁定会扼杀创新并大幅增加预算。 互操作性为何重要 在 AI 驱动的世界中,数据至关重要——而且需要大量数据。...Clickhouse、Dremio 和 Trino 是很好的例子,它们允许您查询来自多个来源的数据,而无需迁移数据。...目录,灵活性和性能 像 Polaris 和 Tabular 这样的数据目录提供高性能功能,并且具有现代数据架构所需的灵活性。...这些工具旨在与开放式表格格式一起使用,使用户能够高效地管理和查询大型数据集,而不会受到供应商特定限制的约束。这有助于确保您的 AI 模型可以实时访问它们所需的数据,无论数据存储在何处。

    9810
    领券