首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据的误区:数据统计大数

Hadoop只是大数据时代的一个必要条件,大数据还有一个明显的标志是数据挖掘和人工智能的紧密结合。这也是我理解的“大数据”与现在很多所谓“大数据”项目最明显的区别之一。...除了上面的“新处理模式”上的区别,个人认为还有一个最主要的区别是:数据统计分析是基于已有数据的纵向归类,而大数据是基于对已有海量数据的处理,对还未产生的数据作出预测和推荐。...数据统计是已经发生的事情,而大数据往往被用于还没有发生的事情预测或者推荐中。 预测和推荐是如何实现的 目前主要的推荐算法大致可以分为两类。一个是基于行为,一个是基于内容。...图2、出租车每天的分布图 这也是我眼中大数据主要与普通的数据统计分析最大的不同:数据统计可以帮助你发现疾病,但大数据可以不但帮助你发现,且帮助你治疗疾病。...如今,行业内不少人打着“数据统计和分析”的旗号来做大数据,让很多外行人陷入了误区:数据统计并非等于大数据。无论数据统计也好,大数据也罢,其实都是为了使我们的工作变得更为有效,让决策更为理性而准确。

66320

大数据的误区:数据统计大数

我只能就自己的工作经历,来谈一下我眼中的大数据。 什么是大数据?...除了上面的“新处理模式”上的区别,个人认为还有一个最主要的区别是:数据统计分析是基于已有数据的纵向归类,而大数据是基于对已有海量数据的处理,对还未产生的数据作出预测和推荐。...数据统计是已经发生的事情,而大数据往往被用于还没有发生的事情预测或者推荐中。 预测和推荐是如何实现的 目前主要的推荐算法大致可以分为两类。一个是基于行为,一个是基于内容。...图2、出租车每天的分布图 这也是我眼中大数据主要与普通的数据统计分析最大的不同:数据统计可以帮助你发现疾病,但大数据可以不但帮助你发现,且帮助你治疗疾病。...如今,行业内不少人打着“数据统计和分析”的旗号来做大数据,让很多外行人陷入了误区:数据统计并非等于大数据。无论数据统计也好,大数据也罢,其实都是为了使我们的工作变得更为有效,让决策更为理性而准确。

55920
您找到你想要的搜索结果了吗?
是的
没有找到

有关大数据的误区:数据统计 大数

另外,数据统计并不等同于大数据,数据统计大数据的区别就在于人工智能。长文慎入: 近两年来,“大数据”被广泛应用到各行各业,而近阶段又有着明显的过热迹象。...除了上面的“新处理模式”上的区别,个人认为还有一个最主要的区别是:数据统计分析是基于已有数据的纵向归类,而大数据是基于对已有海量数据的处理,对还未产生的数据作出预测和推荐。...数据统计是已经发生的事情,而大数据往往被用于还没有发生的事情预测或者推荐中。 预测和推荐,是如何实现的? 目前主要的推荐算法大致可以分为两类。一个是基于行为,一个是基于内容。...图2、出租车每天的分布图 这也是我眼中大数据主要与普通的数据统计分析最大的不同:数据统计可以帮助你发现疾病,但大数据可以不但帮助你发现,且帮助你治疗疾病。...如今,行业内不少人打着“数据统计和分析”的旗号来做大数据,让很多外行人陷入了误区:数据统计并非等于大数据。无论数据统计也好,大数据也罢,其实都是为了使我们的工作变得更为有效,让决策更为理性而准确。

70380

大数据误区】大数据是万能的?大数据=数据统计

Hadoop只是大数据时代的一个必要条件,大数据还有一个明显的标志是数据挖掘和人工智能的紧密结合。这也是我理解的“大数据”与现在很多所谓“大数据”项目最明显的区别之一。...除了上面的“新处理模式”上的区别,个人认为还有一个最主要的区别是:数据统计分析是基于已有数据的纵向归类,而大数据是基于对已有海量数据的处理,对还未产生的数据作出预测和推荐。...数据统计是已经发生的事情,而大数据往往被用于还没有发生的事情预测或者推荐中。 预测和推荐是如何实现的 目前主要的推荐算法大致可以分为两类。一个是基于行为,一个是基于内容。...图2、出租车每天的分布图 这也是我眼中大数据主要与普通的数据统计分析最大的不同:数据统计可以帮助你发现疾病,但大数据可以不但帮助你发现,且帮助你治疗疾病。...如今,行业内不少人打着“数据统计和分析”的旗号来做大数据,让很多外行人陷入了误区:数据统计并非等于大数据。无论数据统计也好,大数据也罢,其实都是为了使我们的工作变得更为有效,让决策更为理性而准确。

1K60

秒懂数据统计、数据挖掘、大数据、OLAP的区别

导读:在大数据领域里,经常会看到例如数据挖掘、OLAP、数据统计等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。...今天,我们就来通过一些大数据在高校应用的例子,来为大家说明白—数据挖掘、大数据、OLAP、数据统计的区别。 ?...从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据挖掘,大数据。 ? 数据统计据统计是最基本、最传统的数据分析,自古有之。...传统的查询和报表工具是告诉你数据库中有什么(What happened) OLAP 联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析...总结 从数据分析的角度来看,目前绝大多数学校的数据应用产品都还处在数据统计报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而能够达到大数据应用阶段的非常少,至少还没有用过有效的大数据集

1.3K50

大数据、数据分析、数据统计、数据挖掘、OLAP之间的差异

今天,我们就来通过一些大数据在高校应用的例子,来为大家说明白—数据挖掘、大数据、OLAP、数据统计之间的差异。...从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据挖掘,大数据。...[图片] 二、数据统计据统计是最基本、最传统的数据分析,自古有之。是指通过统计学方法对数据进行排序、筛选、运算、统计等处理,从而得出一些有意义的结论。...[图片] 传统的查询和报表工具是告诉你数据库中有什么(What happened) 三、OLAP 联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析...[图片] 总结 从数据分析的角度来看,目前绝大多数学校的数据应用产品都还处在数据统计报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而能够达到大数据应用阶段的非常少,至少还没有用过有效的大数据集

1.6K00

日活跃数千万,10亿级APP大数据统计分析平台的架构演进

本文将介绍大数据业务与技术的碰撞产物之一:美图大数据统计分析平台的架构演进,希望通过这次分享能给大家带来一些解决数据业务与架构方面的思考。...如果有做过大数据相关开发的同学应该知道数据统计是一个比较尴尬的事情,第一个它可能不是一个非常有技术含量的事情,对于技术人员的成长来说不是非常好。...在这个节点上写一些简单的 shell 或者 PHP 脚本来实现统计逻辑,配置相应的 crontab 来定时触发统计任务,最终把数据结果存储到 MySQL 供展示层调用呈现报表。...尽量丰富数据源 在平时的需求中,会越来越多遇到需要导入业务方的 MySQL 的数据来做简单的数据统计或者 Join 计算。...作者:卢荣斌 简介:毕业于厦门大学,2014 年加入美图,主导美图大数据平台架构设计与开发工作,负责美图大数据基础建设、数据服务架构以及数据统计分析等工作,经历过美图大数据平台从无到有的搭建与架构演进,

77620

日活跃数千万,10亿级APP大数据统计分析平台的架构演进

本文将介绍大数据业务与技术的碰撞产物之一:美图大数据统计分析平台的架构演进,希望通过这次分享能给大家带来一些解决数据业务与架构方面的思考。...如果有做过大数据相关开发的同学应该知道数据统计是一个比较尴尬的事情,第一个它可能不是一个非常有技术含量的事情,对于技术人员的成长来说不是非常好。...在这个节点上写一些简单的 shell 或者 PHP 脚本来实现统计逻辑,配置相应的 crontab 来定时触发统计任务,最终把数据结果存储到 MySQL 供展示层调用呈现报表。...尽量丰富数据源 在平时的需求中,会越来越多遇到需要导入业务方的 MySQL 的数据来做简单的数据统计或者 Join 计算。...作者:卢荣斌 简介:毕业于厦门大学,2014 年加入美图,主导美图大数据平台架构设计与开发工作,负责美图大数据基础建设、数据服务架构以及数据统计分析等工作,经历过美图大数据平台从无到有的搭建与架构演进,

1.1K20

京东实时计算架构演进之路

本文为作者投稿,作者简介:诸葛子房,曾供职于京东,现就职于BAT,在大数据领域有多年实践经验 ?...基于mysql的实时数据统计方案就比较适合了。 步骤:将线上业务系统数据实时同步到大数据中心(在mysql的基础上搭建了一套大数据架构),避免了Hadoop生态庞大复杂的体系。...基于mysql数据宽表进行数据统计,将统计结果写到mysql指标结果表中,输出一些报表或者服务。详细步骤见下图。...(2)订单量亿级(以京东主站为例) 随着公司的发展,数据体量的增大,达到千万甚至亿级别时,基于mysql的数据统计方案已经完全没办法满足统计需求了,mysql查询也查不动了。...架构优缺点: (1)能够支撑亿级数据量的统计需求,对于大数据量友好 (2)时效性较高 (3)开发简单,能够快速应对业务需求。 ?

68820

【XL-LightHouse】开源通用型流式大数据统计系统介绍

概述XL-LightHouse是针对互联网领域繁杂的流式数据统计需求而开发的一套集成了数据写入、数据运算、数据存储和数据可视化等一系列功能,支持大数据量,支持高并发的【通用型流式大数据统计平台】;XL-LightHouse...而XL-LightHouse是以流式大数据统计为切入点,推动流式统计在诸多行业内的快速普及和大规模应用,定位是以一套服务使用较少的服务器资源同时支撑数以万计、数十万计的流式数据统计需求的大数据平台,致力于应对这种呈现...收益XL-LightHouse代表着一种以通用型流式大数据统计技术为切入点,低成本实现企业数据化运营的理念。...此外,XL-LightHouse对中小企业友好,它大大降低了中小企业使用流式大数据统计的技术门槛,通过简单的页面配置和数据接入即可应对繁杂的流式数据统计需求。...XL-LightHouse作为一个通用型流式大数据统计平台,侧重于帮助企业解决繁杂的流式数据统计问题。

49430

SAP后台执行大数据量报表的设置技巧

适用场景:查询类报表。 适用人员:所有。...案例需求:如需要查询导出整年或者近几年的所有采购合同的执行情况表,由于此报表纵深查询了采购合同对应的采购订单以及发货信息,开票信息等多个环节,查询速度相当缓慢,直接查询容易出现如下“Time Limit...在所要执行的报表中正确输入查询条件,然后根据菜单“程序”——“后台执行”进行后台作业的配置。 ? 选择输出设备(LP01,根据各自公司配置填列)以及相关参数,一般默认即可,点击“√”进入到下一步。...这个时候假设我们发现所要执行的作业已经完成(查看“状态”一栏),就拿最后一条作业为例,如何进行报表的导出呢? 双击记录,或者勾选最前面一栏点击“假脱机”进入到“输出控制器:假脱机请求的清单”界面。

1.4K10

日活跃数千万,10亿级APP大数据统计分析平台的架构演进

本文将介绍大数据业务与技术的碰撞产物之一:美图大数据统计分析平台的架构演进,希望通过这次分享能给大家带来一些解决数据业务与架构方面的思考。...如果有做过大数据相关开发的同学应该知道数据统计是一个比较尴尬的事情,第一个它可能不是一个非常有技术含量的事情,对于技术人员的成长来说不是非常好。...美图其实有非常多的 APP,每个 APP 基本上都会有相应的产品运营、销售以及数据分析的同学,这些同学会提各式各样数据统计的需求,比如数据报表或者数据分析的需求。...在这个节点上写一些简单的 shell 或者 PHP 脚本来实现统计逻辑,配置相应的 crontab 来定时触发统计任务,最终把数据结果存储到 MySQL 供展示层调用呈现报表。...尽量丰富数据源 在平时的需求中,会越来越多遇到需要导入业务方的 MySQL 的数据来做简单的数据统计或者 Join 计算。

2.4K70

知行大数据分析平台需求说明

知行大数据分析平台 需求规格说明书 文件变更记录 版本号日期变更人变更摘要批准人V0.62019-12-30XX制定《需求规格说明书》V1.02019-01-02XX、XX整理原始sql 项目背景 尽管学校多年的信息化应用积累了大量的数据...目前的公司现状: 数据量大,现有MySQL业务数据库直接读取模式不能满足业务统计性能 系统多、数据分散,缺少从营销、咨询、报名到教学等等完整业务环节的数据贯通查询与分析 缺少统一的集团数据、报表运行和系统体系...,尤其年底各个部门排队等DBA协助出数据 缺少元数据、数据集合的规范存储,业务部门有数据分析角度需求时,需要程序员、DBA突击查数据、做报表 迫切需要建设大数据分析平台,来提高学校的用户服务水平和教育质量...统一集团数据中心,把分散的业务数据进行预先处理和存储 根据业务分析需要,从海量的用户行为数据中进行挖掘分析,定制多维的数据集合,形成数据集市,供各个场景主题使用 前端业务数据展示选择和控制,选取合适的前端数据统计...展现响应 对于报表展现的内容刷新,页面数据的请求到展现的过程总体时间不能超过5秒。 服务器配置 一期共需要十台服务器,后期每年随业务量进行扩展。

77120

今日指数项目之需求调研【三】

所以需要考虑整个大数据平台的吞吐量(网络、磁盘IO)、响应速率、计算能力、高并发性、高可用、维护性方便等,以满足多业务场景下,不同应用需求的建设任务,比如多维分析、实时计算、即席查询和数据统计分析等应用功能...应用响应指标: 数仓应用项目离线报表30秒内完成数据响应查询; 实时大屏数据展示5秒内完成数据响应查询; 应用平台支持并发执行500个用户查询请求; *类型* *业务场景* *业务场景特征...实时大屏报表生成 当日实时报表 50 2s 历史报表 历史报表生成 跨年历史报表生成 20 30s 实时行情 指标数据实时展示 页面实时查询 50 1s 数据存储规模 秒级行情(Hbase):存储5...自动在所有集群上对数据进行均衡存储; 3、平台所有节点及存储都运行在X86服务器上,保证集群扩展时在存储设备和节点采购使用的便利性; 需对技术组件做出选型: 数据采集:flume,socket,sqoop 数据存储:mysql...kylin 具体版本 产品 版本 zookeeper 3.4.5 kafka 1.0.0 hbase 1.2.0 hadoop 2.6.0 flink 1.7.0 flume 1.6.0 mysql

31920

【钱塘号专栏】一文读懂数据统计、数据挖掘、大数据、OLAP的区别

大数据领域里,经常会看到例如数据挖掘、OLAP、数据统计等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。...今天,我们就来通过一些大数据在高校应用的例子,来为大家说明白—数据挖掘、大数据、OLAP、数据统计的区别。 ?  ...从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据挖掘,大数据。 ?   数据统计   数据统计是最基本、最传统的数据分析,自古有之。...传统的查询和报表工具是告诉你数据库中有什么(What happened)  OLAP   联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析...总结   从数据分析的角度来看,目前绝大多数学校的数据应用产品都还处在数据统计报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而能够达到大数据应用阶段的非常少,至少还没有用过有效的大数据集

66040
领券