Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >解读 | 数据分析的发展和演变都经过哪几个阶段?

解读 | 数据分析的发展和演变都经过哪几个阶段?

作者头像
CDA数据分析师
发布于 2022-06-28 13:11:09
发布于 2022-06-28 13:11:09
8440
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

CDA数据分析师 出品

作者: Deepesh Nair

编译: Mika

近年来,我们在信息技术领域取得了巨大进步,在技术生态领域中取得的一系列革命性成果也确实值得称赞。在过去的十年到二十年里,数据和分析一直是非常热门的词汇。因此我们需要明确它们是如何相互关联的,市场中扮演什么角色,以及将如何重塑商业业务。

对于那些已经意识到其潜力的人群来说,科技是一种福音,然而对于那些无法跟上其快速发展的人群来说,这也是一种考验。如今,几乎每个行业都离不开数据分析。

在本文中将总结近年来数据分析的发展和演变,简化各种术语,对一些常见应用场景进行解释。让我们开始吧!

数据分析1.0 → 商业智能需求

这是数据仓库的兴起时期,客户(业务)和生产过程(交易)被集中到巨大的存储库中,如eCDW(企业整合数据仓库)。在对商业现象的客观理解方面取得了真正的进展, 从而让管理者在做出决策时能够基于对事实的理解,而不是仅凭直觉

这个阶段中数据通过ETL和BI工具收集、转换和查询。分析类型主要分为描述性(发生了什么)和诊断性(为什么会发生)。

然而,这个阶段的局限在于数据仅在公司企业内部使用,即商业智能活动只能处理过去发生的事情,而不能对未来趋势进行预测。

数据分析 2.0 →大数据

随着各大企业都纷纷走出舒适区,试图用更广泛的方法进行更复杂的分析时,前一阶段的数据分析局限性变得更加突出。

企业都开始通过外部资源获取信息,比如点击流、社交媒体、互联网等,与此同时对新工具的需求也越发明显。不可避免地,“大数据”一词出现了,为了区分那些纯粹来自公司内部系统的小数据。

在这个阶段,公司希望员工能够通过快速处理引擎帮助处理大量数据。他们没预想到的是,因此应运而生的新兴的群体,即如今所称的“开源社区”将产生巨大的影响力,这也是数据分析 2.0时代的标志。

在社区前所未有的支持下,大数据工程师,Hadoop管理员等角色在就业领域发展壮大,并且对每个IT企业都至关重要。科技公司急于开发新的框架,这些框架不仅能够收集、转化处理大数据,而且还能在集成预测性分析。而且,进一步通过描述性和诊断分析的结果检测趋势、聚类和异常,并预测未来趋势,这也使其成为重要的预测工具。

在今天的技术生态系统中,我个人认为“大数据”这个术语已经被大量使用,甚至滥用。从技术上讲,如今“大数据”指的是所有数据,或者只是指数据。

数据分析 3.0→ 功能强大的数据产品

开创性的大数据公司开始投资数据分析,从而支持面向客户的产品,服务和功能。它们通过更好的搜索算法、购买建议以及针对性广告吸引用户访问其网站,所有这些都是由数据分析所驱动的。大数据现象迅速蔓延,如今不仅是科技公司在通过数据分析开发产品和服务,几乎每个行业的公司都是如此。

另一方面,大数据技术的普及带来了好坏参半的影响。在科技巨头收获大量利润取得成功的同时,大多数企业和非科技公司却因为忽略数据而失败惨重。因此,数据科学领域应运而生,旨在使用科学方法、探索过程、算法等从各种形式的数据中获得知识和分析见解。

实际上,数据科学领域是跨学科的,它被定义为“结合统计、数据分析、机器学习等相关方法的概念”,从而用数据“理解和分析实际现象”。换句话说,良好的数据加上出色的训练模型能够产生更好的预测结果。新一代的量化分析师被称为数据科学家,他们拥有计算和数据分析技能。

科技行业在数据科学的帮助下迅速发展,并充分利用预测性和规范性对未来趋势进行预测。企业间也开启了数据分析的竞争,公司不仅通过改善内部决策等传统方式,而且还在不断开发更有价值的产品和服务。这是数据分析 3.0时期的精髓。

如今数据分析产生了巨大转变。公司正以超乎想象的速度发展,在内部设立更多的研发部门,比如数据科学家、数据工程师、解决方案架构师、首席分析师等人员构成的数据分析团队。

数据分析 4.0 → 自动化功能

主要有四种分析类型:描述,阐述过去; 诊断,利用过去的数据研究现在; 预测,通过基于过去数据的见解来预测未来; 规范,通过模型指导最佳行为。

虽然数据分析3.0包含了上述所有类型,但它强调的是最后一种,并且引入了小规模自动化分析的概念。

通过机器学习创建更多模型,从而让预测变得更加细化和精确。但是,部署这类定制模型的成本和时间是十分昂贵的。最终,通过智能系统实现自动化的数据分析4.0时代到来了。

毫无疑问,人工智能、机器学习、深度学习将带来深刻的影响。机器翻译、智能回复、聊天机器人、会议助理等功能将在未来几年内得到广泛应用。数据挖掘技术、机器学习算法都已取得了大量成果,自动化分析将成为数据分析的新阶段。

数据分析 5.0 → 接下来会是什么

我们可以将自动化理解为,人与智能机器的强强联合,从而实现更好的成果。

与其思考“人类的哪些工作将被机器取代?”我宁愿乐观地考虑,在机器的帮助下,企业能取得哪些新成就?我们该如何在灾难易发地区,通过人工智能程序减少伤亡人数;或者如何在贫困地区建立人工智能驱动的电子学校等。

总而言之,我对数据分析的发展充满自信,关键在于我们能否积极地接受和应对其带来的影响。

原文链接:

https://towardsdatascience.com/the-evolution-of-analytics-with-data-8b9908deadd7

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
NIO 读数据和写数据方式
整个 NIO 体系包含的类远远不止这三个,只能说这三个是 NIO 体系的 “核心 API”。上面已经对这三个概念进行了基本的阐述,这里就不多做解释了。
happyJared
2019/08/08
7380
【死磕Netty】-----NIO基础详解
原文出处http://cmsblogs.com/ 『chenssy』 转载请注明原创出处,谢谢! Netty 是基于Java NIO 封装的网络通讯框架,只有充分理解了 Java NIO 才能理解好Netty的底层设计。Java NIO 由三个核心组件组件: Buffer Channel Selector 缓冲区 Buffer Buffer 是一个数据对象,我们可以把它理解为固定数量的数据的容器,它包含一些要写入或者读出的数据。 在 Java NIO 中,任何时候访问 NIO 中的数据,都需要通过缓冲区(B
用户1655470
2018/04/26
1.3K0
【死磕Netty】-----NIO基础详解
Java面试常考的 BIO,NIO,AIO 总结
熟练掌握 BIO,NIO,AIO 的基本概念以及一些常见问题是你准备面试的过程中不可或缺的一部分,另外这些知识点也是你学习 Netty 的基础。
Java技术江湖
2019/09/25
8160
Java面试常考的 BIO,NIO,AIO 总结
彻底搞懂NIO效率高的原理
这篇文章读不懂的没关系,可以先收藏一下。笔者准备介绍完epoll和NIO等知识点,然后写一篇Java网络IO模型的介绍,这样可以使Java网络IO的知识体系更加地完整和严谨。初学者也可以等看完IO模型介绍的博客之后,再回头看这些博客,会更加有收获。
全菜工程师小辉
2019/08/16
2.6K0
BIO、NIO、IO多路复用模型的演进&Java NIO 网络编程
上文介绍了网络编程的基础知识,并基于 Java 编写了 BIO 的网络编程。我们知道 BIO 模型是存在巨大问题的,比如 C10K 问题,其本质就是因其阻塞原因,导致如果想要承受更多的请求就必须有足够多的线程,但是足够多的线程会带来内存占用问题、CPU上下文切换带来的性能问题,从而造成服务端崩溃的现象。怎么解决这一问题呢?优化呗,所以后面就有了NIO、AIO、IO多路复用。本文将对这几个模型详细说明并基于 Java 编写 NIO。
王二蛋
2024/01/18
7900
Java 中 3 种常见的 IO 模型
如下图,应用程序发出一个 read 调用,内核空间需要经历准备数据的几个阶段,准备好之后返回数据给应用程序。期间如果另一个应用程序也需要 read 调用,那么它必须等待;这就是阻塞。
wsuo
2021/06/24
3050
012. NIO 非阻塞网络编程
1. Java NIO ---- 始于 Java1.4,提供了新的 JAVA IO 操作非阻塞 API。用意是替代 Java IO 和 Java Networking 相关的 API。 三个核心组件 Buffer 缓冲区 Channel 通道 Selector 选择器 2. Buffer 缓冲区 ---- 1. 介绍 缓冲区本质上是一个可以写入数据的内存块(类似数组),然后可以再次读取。此内存块包含在 NIO Buffer 对象中,该对象提供了一组方法,可以更轻松地使用内存块。 相比较直接对数组的操
山海散人
2021/03/03
4190
012. NIO 非阻塞网络编程
一篇文章搞定Netty入门
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
用户1212940
2019/11/13
4270
java NIO浅析
NIO主要有三大核心部分:Channel(通道),Buffer(缓冲区),Selector(选择器)。传统IO基于字节流和字符流进行操作,而NIO基于Channel和Buffer进行操作,数据总是从通道读取到缓冲区中,或者从缓冲区写入到通道中。Selector用于监听多个通道的事件(比如:连接打开,数据到达)。因此,单个线程可以监听多个数据通道。
Java阿呆
2020/11/04
7190
java NIO浅析
Java NIO?看这一篇就够了![通俗易懂]
大家好,又见面了,我是你们的朋友全栈君。 ✎前言 现在使用NIO的场景越来越多,很多网上的技术框架或多或少的使用NIO技术,譬如Tomcat,Jetty。学习和掌握NIO技术已经不是一个JAVA攻城
全栈程序员站长
2022/09/08
3530
Java NIO?看这一篇就够了![通俗易懂]
java nio_(一) Java NIO 概述[通俗易懂]
通常在进行同步I/O操作时,如果读取数据,代码会阻塞直至有 可供读取的数据。同样,写入调用将会阻塞直至数据能够写入。传统的Server/Client模式会基于TPR(Thread per Request),服务器会为每个客户端请求建立一个线程,由该线程单独负责处理一个客户请求。这种模式带来的一个问题就是线程数量的剧增,大量的线程会增大服务器的开销。大多数的实现为了避免这个问题,都采用了线程池模型,并设置线程池线程的最大数量,这由带来了新的问题,如果线程池中有200个线程,而有200个用户都在进行大文件下载,会导致第201个用户的请求无法及时处理,即便第201个用户只想请求一个几KB大小的页面。传统的 Server/Client模式如下图所示:
全栈程序员站长
2022/09/08
6120
java nio_(一) Java NIO 概述[通俗易懂]
《跟闪电侠学Netty》阅读笔记 - 开篇入门Netty
《跟闪电侠学Netty》 并不是个人接触的第一本Netty书籍,但个人更推荐读者把它作为作为第一本Netty入门的书籍。
阿东
2023/09/02
5750
《跟闪电侠学Netty》阅读笔记 - 开篇入门Netty
【面试题精讲】javaIO模型之NIO
NIO(New I/O)是Java提供的一种非阻塞I/O模型,它在JDK 1.4中引入。与传统的I/O模型相比,NIO提供了更高效、更灵活的I/O操作方式。
程序员朱永胜
2023/10/22
2370
NIO简述
一个 Buffer 本质上是内存中的一块,我们可以将数据写入这块内存,之后从这块内存获取数据
leobhao
2022/06/28
3200
NIO简述
最强开源网络应用框架 Netty,没有之一,直接“榨干”CPU!
👆点击“博文视点Broadview”,获取更多书讯 在开始了解Netty是什么之前,我们先来回顾一下,如果需要实现一个客户端与服务端通信的程序,使用传统的IO编程,应该如何来实现? IO编程 我们简化一下场景:客户端每隔两秒发送一个带有时间戳的“hello world”给服务端,服务端收到之后打印它。 在传统的IO模型中,每个连接创建成功之后都需要由一个线程来维护,每个线程都包含一个while死循环,那么1万个连接对应1万个线程,继而有1万个while死循环,这就带来如下几个问题。 线程资源受限:线程是
博文视点Broadview
2022/03/10
6480
NIO学习四-Selector
前面我们已经简单的学习了channel,知道channel作为通道,可以在通道中进行读写操作,同时知道ByteChannel是双向的。对于NIO的优势在于多路复用选择器上,在Nginx、Redis、Netty中都有多路复用的体现。因此学习Selector是有必要的。
路行的亚洲
2020/07/16
4030
为什么一个还没毕业的大学生能够把 IO 讲的这么好?
Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。
cxuan
2020/09/14
6310
Java IO 与 NIO:高效的输入输出操作探究
输入输出(IO)是任何编程语言中的核心概念,而在Java中,IO操作更是应用程序成功运行的基石。随着计算机系统变得越来越复杂,对IO的要求也日益增加。在本文中,我们将探讨Java IO和非阻塞IO(NIO)的重要性以及如何在Java中实现高效的输入输出操作。
程序那些事
2023/10/17
2630
Java面试必问通信框架NIO,原理详解
新的输入/输出 (NIO) 库是在 JDK 1.4 中引入的,弥补了原来的 I/O 的不足,提供了高速的、面向块的 I/O。
李红
2019/05/31
1.3K0
Java面试必问通信框架NIO,原理详解
JavaIO流:NIO梳理
NIO 也叫 Non-Blocking IO 是同步非阻塞的 IO 模型。线程发起 IO 请求后,立即返回。同步指的是必须等待 IO 缓冲区内的数据就绪,而非阻塞指的是,用户线程不原地等待 IO 缓冲区,可以先做一些其他操作,但是要定时轮询检查 IO 缓冲区数据是否就绪。
栗筝i
2022/12/02
3620
JavaIO流:NIO梳理
推荐阅读
相关推荐
NIO 读数据和写数据方式
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档