前言
经过第一周的试听,第二周的退补选,本学期的《R语言数据分析》课程终于在周四、周五正式开课。
作为一门开源编程课,拿到点名名单时,惊了——这门课只有2个女生选课。经过课程宣传之后,本周终于多了一个女生……是的,这门课只有三个女生选课,占全班人数的1/15不到。
感慨当今女科学家少之余,又在反思是不是自己教学内容不够吸引,所以女生选课这么少。中国的第一位理科类诺贝尔奖来自屠呦呦老师,由女研究员主导技术领域的发展和潜能让人肃然起敬。
对于教学大纲,在上学期教学的基础上,进行了最新技术的增加。
当你学完本学期课程,你可以轻而易举的独立完成:
一篇数据分析报告、
人文社科类的社交网络分析、观点挖掘、汉语分词,
本课程还包括使用R的packages爬取网络数据、正则表达式提取特定数据的内容,你可以使用这部分知识完成数据挖掘的项目作业。
本课程是一门多学科交叉应用性很强的课程,同时欢迎生物、医学领域的学生来学习,我会提供一些课题方向,借助R完成AI生物医学的一些项目。
本学期的课程,理论与上机实践结合,通过期末一个(机器学习/数据挖掘)大项目结束本学期课程。让学生们真正感受到R是一门优于其他分析软件的工具。
课程大纲,sllyabus
基础篇
一 基础篇
1 数学基础
2 R on Mac: Installing & oprations
Mac版R:安装和基础操作
3 R on Windows: Installing & oprations
Windows版R:安装和基础操作
3. RStuido(Mac&Win): Installing & Layout
RStudio:安装与版块功能使用介绍
4.Introduction to R
R的历史、概览、发展、应用领域
5.prime oprations
常见基础操作:读取数据、设置工作空间etc
6.Data Types:Vector,Array,Matrices,Factors,
R中的数据类型及操作
7.Prime Functions
基本命令
8.NA values
缺失值的原因及处理
9.Project Homework:Data Visualisation
项目作业一:数据分析报告及可视化
提高篇
二 提高篇
Writing Code:if-else, for ,while loops, reapt,next,break,
定制化代码
Project Homework:Kaggle Data Analysis
项目作业二:Kaggle数据分析(预测/挖掘)
应用篇
三 应用篇
数据可视化:ggplot2,lattice,rgl
生物医学:微阵列数据处理arrf包etc
基因本体学goTools包etc
微阵列比较基因组杂交aCGH包etc
蛋白质组学:蛋白质结构预测PROcess包etc
基因表达分析EST
金融量化:时序分析、序列分析
数据挖掘:聚类、预测
人文社科:文本挖掘、社交网络分析、分词、观点挖掘
公用数据库介绍
祝各位同学本学期学有所获
领取专属 10元无门槛券
私享最新 技术干货