首页
学习
活动
专区
工具
TVP
发布

YoungGy

专栏成员
145
文章
160330
阅读量
50
订阅数
FSWD_1_BasicHtmlCss
本文是香港中文大学《Full Stack Web Development》系列课程中的笔记
用户1147754
2019-05-29
4020
统计简单学_常用统计量
连续型数据特征 数据特征值的应用 经验法则 盒须图 连续型数据特征 集中趋势 平均数 中位数(群体η\eta,样本X̃ \tilde{X}) 众数 选择:当群体中有离群值时,使用中位数或者众数,
用户1147754
2019-05-27
6820
ML基石_4_FeasibilityOfLearning
数学上的发生几率保证 PAC: probably approximately correct
用户1147754
2019-05-27
2730
R语言_高级数据管理
#数值处理函数 #数学函数 abs sqrt ceiling floor round(x,digits=n) #舍入为指定位的小数 signif #舍入为指定位的有效数字 log(x,base=n) log() #常用对数 log10() exp() #统计函数 mean(x,trim=0.05,na.rm=TRUE) #截尾平均数 median sd var mad quantitle(x,probs) range #求值域 diff(range(x)) sum diff(x,lag=
用户1147754
2019-05-27
5520
R语言_基本数据管理
#创建新变量并保存到原有数据框 #way 1 d = data.frame(x1=1:4,x2=2:5) d$sum = d$x1+d$x2 #way 2 d= transform(d,sum=x1+x2,meanx=(x1+x2)/2) #变量的重编码 d = within(d,{ x1Less2 = NA x1Less2[x1<=2] = "y" x1Less2[x1>2] = "n" }) #变量的重命名 fix(d) names(d)[c(3,4)] = c("sum
用户1147754
2019-05-27
5870
R语言_图形初阶
#输出图形到pdf pdf("mygraph.pdf") attach(mtcars) plot(wt,mpg) abline(lm(mpg~wt)) title("regression of mpg on weight") detach(mtcars) dev.off() #图形参数par设置 opar = par(no.readonly=TRUE) par(lty=2,pch=17) #指定线型2和符号形状17 par(lwd=2,cex=1.5) #指定线宽2,符号大小1.5 par(pin
用户1147754
2019-05-27
6150
R语言_数据结构
#向量 my_vector <- c(1, 2, -8, 9, 16) my_vector[2:4] #矩阵 #矩阵行列命名,默认先排列 cells <- c(1, 36, 24, 12) row_names <- c(“R1″, “R2″) col_names <- c(“C1″, “C2″) my_matrix1 <- matrix(cells, nrow=2, ncol=2, dimnames=list(row_names, col_names)) #矩阵行列命名,并且先排行 my_matrix
用户1147754
2019-05-27
4850
R语言_基础
a = c(1,2,3) #查看帮助 help(mean) ?mean example(mean) help.start() help(package="plyr") help(baseball)
用户1147754
2019-05-27
7650
Hadoop安装教程_单机及伪分布式
配置新的hadoop用户 查看是否配置成功 为hadoop用户增加管理员权限 退出重新登陆
用户1147754
2019-05-27
4810
最大公约数与递归
最大公约数,是两个数共有的素因数乘积。 例如: 462 = 2*3*7*11 1071=3*3*7*17 所以,最大公约数为3*7=21
用户1147754
2019-05-27
8100
ISLR线性回归笔记
对单个的predicter做是否有效(不等于0)的检验可以使用t-test,但是对整体做是否有效(至少有一个系数不等于0)则需要用F-test。
用户1147754
2019-05-27
9230
统计学中的区间估计
统计学中有两大分支——描述性统计学(description stats)和推断性统计学(inference stats)。 推断性统计学中,很重要的一点就是区间估计。
用户1147754
2019-05-27
3.4K0
牛顿迭代法求解平方根
迭代,是一种数值方法,具体指从一个初始值,一步步地通过迭代过程,逐步逼近真实值的方法。 与之相对的是直接法,也就是通过构建解析解,一步求出问题的方法。
用户1147754
2019-05-27
1.5K0
PCA的浅析与深入
PCA(Princile Component Analysis),中文名叫做主成成分分析,它的主要理论是:线性组合输入空间,以期找到一组标准正交基,实现坐标变换。 PCA的主要应用有以下几点:
用户1147754
2019-05-27
7730
组合数学_1_漫谈
广义的组合数学(英语:Combinatorics)就是离散数学,狭义的组合数学是组合计数、图论、代数结构、数理逻辑等的总称。但这只是不同学者在叫法上的区别。总之,组合数学是一门研究离散对象的科学。
用户1147754
2019-05-27
8200
工具_SublimeText
ctrl+n:新文件 ctrl+p:Goto菜单 ctrl+shift+p命令模式 ctrl+·:控制台
用户1147754
2019-05-27
5230
ML基石_3_TypesOfLearning
y = structures. 好像一个很大的多分类问题。 从数据中学习潜在的结构。 比如自然语言处理中,每个单词的词性组合很复杂几乎无穷,但是其中肯定是有某些结构的,你总不可能连续5个动词吧。
用户1147754
2019-05-27
3330
DASI_1_IntroToData
anecdotal evidence: 用极端的个例去判断整体的信息。例如“我叔叔每天吸三根烟身体很棒”来验证“吸烟对人体没有危害”。
用户1147754
2019-05-27
4220
统计简单学_正态分布
正态分布简介 正态分布 自然界中,许多连续型随机变量都呈现钟形分布,又叫正态分布。 正态分布的特性 标准正态分布几率表 标准正态分布 利用z表求标准正态分布几率与z值 利用z表求正态分布几率 检查数据
用户1147754
2019-05-27
1.2K0
R语言包_knitr
科学研究中,可重复性相当重要,即结果能够被复现。 knitr之前,学者们通常通过简单的图片和文字组合交流信息,这种方式效率极低,一方面不利于相互的理解交流,另一方便不利于修改。
用户1147754
2019-05-26
1.8K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档