理想国数据科学特训营于7月23日开营
历时两周的理想国科学特训营于7月23日正式开营了,在已经过去的一星期时间里,同学们在六位老师的带领下,对统计学基础、数据挖掘、运筹学基础及数据科学相关的编程语言有了一定的了解。
全文图片均摄于特训营课堂
经过这一个星期的学习之后,11位同学将分组在老师的带领下进行数据课题研究,将这几天所学知识应用到实践当中。
本期内容将对已经过去的八天课程进行一个简单的回顾与总结。
由于同学们都还在学习高中课程,在数据营的最开始,杜萌老师先向大家讲解了统计学的基础知识。在不到一天的时间里,杜老师由统计学的历史开始,讲解了统计的基础理论、随机变量、概率、中心极限定理、抽样调查、假设检验及线性回归。统计学内容是数据知识的基础,也是与同学们所学的高中知识最接近的内容。为了让同学们充分理解统计,从而更加轻松、高效地应对之后的学习内容,杜老师使用了许多生活中的例子来解释这些理论知识对于数据科学的意义。
在学习理论知识的同时,解决实际问题时所需要使用的编程工具也尤为重要。在数据科学的研究中,Matlab是使用率极高的一种软件。周宇老师向大家介绍了Matlab软件的基本使用方法、绘图、数据导入、数据处理及简单的编程循环。邹龙昊老师则是介绍了现在运用最广泛的编程语言Python的基本知识、Pycham软件的应用及数据可视化的实际案例。邹老师还选择讲解了两个数据科学应用的实际案例——蜂窝数据基站定位和存储系统负载分析。通过这两个案例,老师简单解释了数据处理的原因。
在补充了统计学和编程的基础知识之后,许勤能老师重点介绍了数据挖掘及另一种应用类的编程语言R。许老师从数据挖掘的简单举例开始,讲解了此次数据营最核心的数学建模的原理及线性回归的预测方法。同学们试着使用R语言对老师给予的数据进行建模及预测,同时也尝试了交叉验证的数据处理方法,还简单了解了逻辑回归、邻近算法及时间序列模型。在课程中,同学们需要使用R语言,对老师给出的数据进行处理,比较线性回归、交叉验证及逻辑回归的优劣。
赵杨老师在许老师所讲解的数据挖掘知识基础上,重点讲解了分类与聚类的方法。同学们同时也尝试了解了不平衡分类的处理方法及应用实例。
在课程的最后,郭海男老师带领同学们进入了一个全新的领域——运筹学。郭老师使用了许多现实案例解释了运筹学中的线性规划、灵敏度分析、DEA、博弈论及层次分析法,同时也介绍了anaconda和lingo软件的基本情况,给同学们在之后的项目研究中提供了更多选择。在课程的最后,同学们分组对千禧难题进行了简单的分析,在同学们的激烈讨论中,可以看出大家已经对数据科学有了一定的了解。
在八天紧张的学习后,11位同学现已分成四个小组,将对四位老师选择的数据科学项目进行研究、试验并于数据营结束时做出简单的汇报。同学们将充分利用这几天所学知识,进行分工合作,一起努力将理论知识应用到实际项目当中。
本文编辑:Yvaine 摄影、排版校对:快报君、松林君
快报君提醒>>>“十一假期理想国数学建模课”已开启报名:
上课时间:10月1日-10月7日
课时安排:5天教学(8小时/天);2天模拟比赛(12小时/天)
针对学生:初三至高二或国际学校对应同等年级
学习内容:编程、统计学、数据挖掘、运筹学等基础课程
学习成果:帮助学生提高学术背景,教授学生运用基础知识解决实际问题的问题,团队模拟比赛,以实战演练的方式为HiMCM做冲刺准备
猛戳此文了解数学建模>>>《助力美国名校,你必须知道的HiMCM大赛》
学霸君推荐!>>>IGCSE、A-Level 在读的同学们看过来
助力新学期,理想国IGCSE、A-Level 周末班即将开课:
开课时间:8月24日晚间,25、26日全天
上课时间:学期内逢周五晚及周六日
可选课程:
IGCSE/A-Level 数学
——15年资深A-level数学教师主讲
IGCSE/A-Level 计算机科学
——博士们带你轻松玩转CS
IGCSE/A-Level 物理
——资深A-Level物理教师让物理生动起来
课程表:
领取专属 10元无门槛券
私享最新 技术干货