2018年用R语言做好五件事
1 R语言开源,免费,跨平台。
2 R语言可以做数据科学工作流各个环节的任务。
3 R语言深受数据科学工作者的喜欢。
学习R语言,需要学以致用,活学活用。
博学之,审问之,慎思之,明辨之,笃行之。(《礼记》)
2018年,玩数据和用数据的朋友可以考虑用R语言做好这五件事。
事一:数据可视化
1 清楚每种图形所适合的应用场景
2 熟悉R语言ggplot2包的使用
3 思考利用可视化做探索性分析和数据结果表示
思维训练
1 折线图,条形图,散点图分别有什么作用?
2 ggplot2包画图的原理是什么?如何利用ggplot2设计和生成可以出版的高质量图片?
事二:数据处理
1 掌握数据集的导入和导出
2 熟悉数据的选择,变量的衍生,数据的聚合和连接
3 掌握数据格式的转换
4 熟悉readr包,dplyr包和tidy包的使用
思维训练
1 如何读取json格式数据和数据库的表数据?
2 如何把宽数据转换为长数据?
事三:统计分析
1 R语言是统计编程语言,适合做统计分析
2 R语言对统计学知识有着全面的实现和解读
3 熟悉描述性统计和推断性统计
思维训练
1 描述性统计和推断性统计的异同?
2 常用的统计模型有哪些?可以解决什么问题?
事四:机器学习
1 掌握经典的机器学习算法
2 掌握从小数据中学习,实现数据到商业价值的转换
3 熟悉一系列机器学习包的使用,例如:caret,e1071,gbm,randomForest,glmnet,xgboost等。
思维训练
1 机器学习算法如何选择?参数如何调整?
2 如何提高机器学习算法的精度?
3 如何做特征工程?
事五:数据自动化报告
1 掌握数据自动报告的生成和传播
2 掌握R语言做自动化报告的流程
思维训练
1 数据自动化报告的好处是什么?
领取专属 10元无门槛券
私享最新 技术干货