首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

三面字节总结:Spark+hadoop+数据仓+Flink+kafka 资料一应俱全!

从时间节点上来看,每年的 3月、4月是一年中求职跳槽的黄金季! 最近也收到很多小伙伴的后台留言 “有没有大数据学习资源,进阶学习路线,PDF,电子书,面试文档等等...” 一系列问题,这篇文章等于是针对以上的问题统一做回答了。 肝了一周,做了一些资源筛选,依照自己的学习经验和相关的资料做个整理,把一些我看过的精品视频,技术书籍,学习路线,面试文档等资源一并打包好分享给大家,质量都非常高!! 划重点:建议大家都保存一份!!学完之后不论是 找工作、厂内晋升、还是 跳槽涨薪 都不在话下! 一共分为 5 大板块组成

02

书单 | 从0入门数据分析师的个人成长知识体系

数据分析最近很多朋友问我,怎么样才能成为一名数据分析师呢,我没有基础,能不能做数据分析师呢? 正常智力的人,想要从菜鸟成为一名数据分析师,都是可行的,只不过,数字敏感度好的人,成长更快,那是不是说明,我们就不需要花时间学习数据分析的技能了呢,我之所以把数据分析称之为技能,而不是职能。 是因为,现在我们所处的阶段就是工业化转型信息化的时代,美国天生就是一个大数据国家,现在仍然有19万数据分析师的缺口,目测2016年,国内会有10万左右数据分析师的缺口,即使你是财务、运营、产品,数据分析都是你必备的一种技能

05

从零实现来理解机器学习算法:书籍推荐及障碍的克服

【编者按】并非所有的开发者都有机器学习算法的基础知识,那么开发者如何从零入门来学习好机器学习算法呢?本文总结推荐了一些从零开始学习机器学习算法的办法,包括推荐了一些合适的书籍,如何克服所面临的各种障碍,以及快速获得更多知识的窍门。 从零开始实现机器学习算法似乎是开发者理解机器学习的一个出色方式。或许真的是这样,但这种做法也有一些缺点。 在这篇文章中,你会发现一些很好的资源,可以用来从零开始实现机器学习算法。你也会发现一些看似完美的方法的局限性。你已经从零开始实现机器学习算法并努力学习留下的每一条评论了么?我

05

[变革]上海统计局与一号店、上海钢联战略合作

原标题:上海统计,在拥抱大数据时代中变革 “ 一个大规模生产、分享和利用大数据的时代正在来临。这是一个浩浩荡荡不可阻挡的历史潮流,谁拥有了大数据,谁就占领了制高点,取得了主动权。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础;就企业来说,谁能够有效应用大数据,谁就占得了市场,赢得了机遇。现在许多发达国家纷纷将大数据利用提升到了重要的国家战略层面,我们也要适应这一大势,将大数据视为国家战略资源,主动拥抱大数据时代,积极抢抓机遇、应对挑战。”这是国家统计局局长马建堂在国家统计局与11家企业在

010

为什么说有数据就意味着有钱?那又如何利用数据来挣钱呢?

这是一个“大数据时代”,很明显,它的核心是数据,那数据有什么价值(有钱)呢?如何从数据中提取价值(挣钱)呢?这些问题是我们今天要讨论的。开始讨论之前,先来说下为什么要写这篇文章。其实原因很简单,赶上月底,打算推荐两本对新手有帮助的书籍,但是这和写这篇文章有什么关系呢?其实是这样的,虽说当前很多号主都会有抽奖送书的活动,但是很少有人会仔细的去为每一本书写推荐理由,即便写,基本上也是直接搬运过来了书籍简介。因为我要做一个极客,所以我打算给大家推荐书籍时结合当前的一些技术情况以及这本书的特色来说明下书籍的价值,虽说会花费我不少的时间,但是我觉得这样除了能让大家认识这本书之外,还能学习和了解一些技术。好了,我们开始今天的主题吧!

04

如何更好的使用大数据,这几点你知道吗?

现在大多数公司和企业正在利用大数据来运营他们的业务并创造收入,他们依靠大数据的结果做出决策,提供更好的服务。以下是关于如何成功使用大数据的一些方法。 1.敏捷 敏捷地掌握新兴技术的最新进展。顾客的需求往往在变化,因此,技术必须灵活适应客户的苛刻需求。如果想成功,应该调整收集的数据并处理,以满足客户的需求。‍ 2.实时操作 实时操作业务,以了解客户遇到的各种问题。最好的方法是使用实时数据。因此,要了解业务的缺点,并实施适当的步骤来促进最佳的用户体验和更高的生产力。‍ 3.多种设备 使用不同的设备来收集有关客户

05

【译文】如何开始你的商业分析生涯

每一次参与商业分析论坛或者和学生互动的时候,他们经常问这样两个典型而且被多次解释的问题: 我是一个本科生(或者别的学历),而我很希望能从事分析行业,而我应该怎么做呢? 或者 我想在分析行业干一番大事或打算转行到分析行业,那我又该怎么办呢? 而且,我在我的邮箱或社交媒体上收到的留言也是问同样的问题。为了能给这些人一个最好的答案,我认为最好还是写一篇文章然后给每个人一个入门的平台。 这门学科本身的研究范围就比较广,所以我会给大家提供一份能够执行且关注特殊子主题的概要,然后在后面的文章会提到。 在探讨如何构建你的

08

hadoop 学习之路

当前,越来越多的同学进入大数据行业,有的是底层的技术,有的是工程,有的是算法,有的是业务。每个产品、都需要工程化的实现,以前,工程师都是操练着java/python/c等各种语言操纵中各类的软件,比如jquery,spring、mysql,实现产品的业务逻辑。在大数据时代,要想个性化实现业务的需求,还是得操纵各类的大数据软件,如:hadoop、hive、spark、hbase、jstorm等。笔者(阿里封神)混迹Hadoop圈子多年,经历了云梯1、ODPS等项目,目前base在E-Mapreduce。在这,笔者尽可能梳理下,本文是围绕hadoop的。对于算法、机器学习是另一个范畴,本篇不涉及,不过从事机器学习算法的研发,能力最好在中级之上。

02

2018的第一份书单

1.《fluent python》(中文版:《流畅的python》) 这本书来源于某个公众号的推荐(忘了是哪个了),在读这本书之前,已经阅读了市面上很多python书籍,比如《python核心编程》,《python学习手册》,《python源码剖析》,这些书籍在一定程度上写的很不错,但给你的感觉就像是读官方文档,没有注入作者自己的想法,直到遇上了《流畅的python》,这本书从数据模型开始讨论,从python的基础数据结构开始引入整个python的设计哲学,对!这本书灌输给你的就是python是如何设计它的语言特性的,一般的书你读了可能就是对的,就应该这么写,作者不会去剖析为什么要这么写,这本书不然,处处体现了python的为什么要这么设计,而不是告诉你要怎么写。不剧透了,如果要进阶python,这本书是不二之选。(注:如果有可能可以去读读英文原版,因为我读了翻译版后,找了原版再去复习了一遍,感觉目前的翻译版本翻译的不怎么好,有些细节在翻译的过程中丧失了。) 2.《designing data-intensive application》(暂无翻译版) 这本书是有关数据系统设计的书,可以这么说,读完这本书再去读大数据的相关论文就是事半功倍,很后悔之前没读这本书就读了那些大数据的相关论文,现在慢慢的回过头再去回味那些论文,很多疑惑都解开了。全书以数据库评价指标开头,从单机的数据模型,存储、搜索、文件格式、传输慢慢聊到分布式系统下的一致性和共识,最后再整合,让你拍案叫绝。唯一的遗憾在于它至今没有中文版。 3.《programming in Scala》(中文版:《Scala编程》) 这本书的作者就是Scala的设计者,显然书籍的含金量不容置疑。全书充满着书生的学究气,不把一件事挖到底决不罢休。作为语言的设计者,除了描述Scala的使用,也会讲述Scala这门语言为什么要这么设计。如果你是初学者,我觉得这本书不适合你,虽然这本书也包含了入门,但是作者显然没把你当作初学者看待。 其实还读了一些网上书单推荐的书,例如《高可用架构》,《clean architecture》等,这些书感觉都像是一种描述性的语气讲述着知识点,知其然而不知其所以然,读读即可。

01
领券