相信很多人开始学习一个新的工具的时候,会去买对应的工具书。今天我要说的是R语言学习过程中使用到的一些经典的工具书,它们的缺点。一个词概括,缺点就是:过时。
如果你是一个R语言使用者,并且你是通过看书(你能看到的中文书一般都很老)来学习的,你会发现就算是完成数据读取这么简单的操作,不是代码报错,就是数据读取错了(读取进来的数据错位,几列数据合并在了一起);几个月前你的代码这么写可以,升级R版本后,这么写就不行了;读取个Excel文件居然要装Java环境.......如果你有遇到上述这些问题,就赶紧把你的书扔了(放一边吧,别太冲动),因为你花在上面的时间越多,损失的时间越多。听我下面给你介绍学习R应该学什么。找对学习途径,省心,省力,效果还好!
你能看到的这些中文书,虽然其中有些是三四年前出版的,但是有一些东西仍然显得过时了,更别说那些已经有5年以上历史的老古董了。R作为一个工具,作为一个靠开开源社区维护的软件,它是在不断更新的,因此工具书很容易过时,更何况中文的R语言书大部分是翻译过来的,翻译需要时间,所谓的原创中文书也是从外文书甚至中文书借鉴过来的,这是中文工具书过时的客观原因。
还有一个重要的原因是,近几年随着大数据,机器学习,数据分析等技术在企业中的落地,催生了对数据分析工具的进化需求,R语言在最近几年里,变化很大,在这种变化中,由于外部环境的影响,又形成了一个相对比较优秀的R语言数据分析生态系统。
这个生态系统就是由
Hadley Wickham:一个改变了R的人
担任首席科学家的公司—Rstudio公司旗下的一系列R包组成的,这一系列R包中包含R社区中众所周知的ggplot2,dplyr,shiny,readr,readxl等。下图展示了Rstudio公司旗下的部分R包,这些包形成一个相对比较完善的数据分析生态。
对了,Hadley Wickham的个人网站是:http://hadley.nz/ 。十分建议有兴趣的人前去了解一下。如果你是统计,数学,数据科学相关转业的,那一定要看一下才行。
上面推荐给大家的资源都是英文的资源,没有一定R语言基础的人,学习会很吃力,那你可以选择学习我的《R语言数据分析》课程,我的这个课程主要就是围绕着Rstudio公司的这个R语言数据分析生态系统来展开的。课程包括R语言编程入门,这部分知识主要是帮助还没入门的同学快速入门。紧接着是R数据分析,大数据分析,可视化分析,机器学习,文本分析,统计分析等内容。这是一个比较全面的R语言课程,学习完这个课程以后,你不需要再学习其它R课程了。你可以长按识别如下二维码查看该课程:
该课程还有一个配套的免费入门课程,你也可以先学习免费课程来了解课程特色,看看是否适合自己,免费课程链接如下:
https://study.163.com/course/courseMain.htm?courseId=1002815006&share=2&shareId=3188405
领取专属 10元无门槛券
私享最新 技术干货