2月8日下午,《万物皆算法》---漫谈大数据与人工智能讲座在863创智广场圆满举行,来自河南中原大数据研究院的田老师结合自身从业经历,以完善的理论架构及生动的案例分析,深入浅出的为大家讲述了大数据和人工智能的前世今生。
“
下面是今天的讲座重点,完整的66页课件可关注“洛阳国家大学科技园”官方微信并回复“大数据”即可下载获得。
”
1
大数据产业现状
大数据其实是一个比较抽象和笼统的概念,应该说这个词是为了涵盖性地表达一系列生产和业务行为的一个统称。
大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,同时也是由多种行业分工和协同配合而产生的一个复合性极高的行业。
2
大数据产业生产流程
其中每个环节都是非常重要的数据生命环节,每个环节的生产加工行为都是有其价值的,并且每个环节做到极致都可以成就一个伟大的公司。
整个完整的产业生态圈就是大数据,它的缩影也渗透在任何一家以数据作为运营基础的公司中。
3
大数据产业的价值与意义
数据通过各种软件进行收集,通过网络进行传输,通过云数据中心进行存储,通过数据科学家或者行业专家进行建模和加工,最后数据分析得到的是一种知识,是一种人们通过数据洞悉世界的能力。
减少试错的机会
减少成本
降低风险
解放劳动力
4
大数据处理流程的整体架构
5
大数据处理技术架构图
6
大数据市场方向
7
大数据架构方向
大数据架构方向更多注重的是Hadoop、Spark、Storm等大数据框架的实现原理、部署、调优和稳定性问题,以及它们与Flume、Kafka等数据流工具以及可视化工具的结合技巧,再有就是一些工具的商业应用问题,如Hive、Cassandra、HBase、PrestoDB等。
8
大数据架构方向主要内容
架构理论:关键词有高并发、高可用、并行计算、MapReduce、Spark等。
数据流应用:关键词有Flume、Fluentd、Kafka、ZMQ等。
存储应用:关键词有HDFS、Ceph等。
软件应用:关键词有Hive、HBase、Cassandra、PrestoDB等。
可视化应用:关键词有HightCharts、ECharts、D3、HTML5、CSS3等
9
大数据分析方向
大数据分析方向的人才更多注重的是数据指标的建立,数据的统计,数据之间的联系,数据的深度挖掘和机器学习,并利用探索性数据分析的方式得到更多的规律、知识,或者对未来事物预测和预判的手段。
10
大数据分析方向主要内容
数据库应用:关键词有RDBMS、NoSQL、MySQL、Hive、Cassandra等。
数据加工:关键词有ETL、Python等。
数据统计:关键词有统计、概率等。
数据分析:关键词有数据建模、数据挖掘、机器学习、回归分析、聚类、分类、协同过滤等。
业务知识:行业性
11
大数据开发方向
大数据开发方向更多注重的是服务器端开发,数据库开发,呈现与可视化,人机交互等衔接数据载体和数据加工各个单元以及用户的功能落地与实现。
12
大数据开发方向主要内容
大数据开发研究的主要方面
数据库开发:关键词有RDBMS、NoSQL、MySQL、Hive等。
数据流工具开发:关键词有Flume、Heka、Fluentd、Kafka、ZMQ等。
数据前端开发:关键词有HightCharts、ECharts、JavaScript、D3、HTML5、CSS3等。
数据获取开发:关键词有爬虫、分词、自然语言学习、文本分类等。
领取专属 10元无门槛券
私享最新 技术干货