首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

读《白话大数据和机器学习》拆解

工作以来从没定过计划,最近脑袋突发奇想,竟然给自己定了三个计划,看着计划挺靠谱,那咱就按着计划实施吧。计划之中的一项是要能了解最新的技术,并能结合实际的工作场景,分析新技术在实际业务场景中应用的可能性或者应用的可行性,以及实际的业务场景和新技术在结合过程中有可能有哪些不适用的情况,以及如何调整技术来适用业务,或者为业务寻找更合适的技术。目前最火热的技术非大数据莫属,所以咱也凑个热闹,打算先拿大数据先入手预热预热。

虽然前两年也读过类似的书,但是都是以扩充眼界为目的而读,所读的也多是致用类书,而非技术或者业务专业性很强的理论书,所以也就空有概念性的认识。本次既然打算做个稍微详尽的探索性研究,索性就多读些专业性的书,便于从整体和细节处都有个全面的认识;

读的第一本大数据相关的书是叫做《白话大数据和机器学习》,本书整体上开篇先介绍了大数据的概念,合乎主旨,但是后面的内容很大的篇幅都是在介绍数学理论,虽然理论介绍的很浅显,但是整书四份之三的内容都是介绍数学理论,这个似乎和我打算读这本书的初衷有所不符。数学理论虽是机器学习和大数据的理论基础,但是本书名为白话,这个似乎和白话有些差距。但是本书阅读后还是有些输入,总结的值得学习的地方;大数据本质是用来消除不确定性进而取得经济或者科技效益;目前学术上的概率及统计理论宏观上说本质都是先验的,说白了就是先假设出一个理论,然后去用数据去验证理论的正确性,而未来的希望是数据样本足够多了之后,也就是获取的数据样本足够覆盖各种业务场景后,希望能用这些数据直接抽象出理论,这个应该可以说是大数据和目前的样本数据的直接区别吧。书中也对大数据从业者提供了指导,大数据主要分两个方向,用比较IT的话来表述就是一个是前端,一个是后端;前端偏向于程序的开发,结合业务进行数据分析,而后端则主攻大数据的存储及效率。当然两者是相辅相成的,包括运维团队。书中对于机器学习的理论介绍不多,但是机器学习的理论基础都有涉及,从我看后的感觉来看对机器学习的理解还是很模糊。

白话整书更倾向于介绍性,使大家对此技术有一个概念性认知。从目前看下来对投资行业来说本书可以展开的内容颇少,待后续继续研究。。。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190217G01B2600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券