前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用R进行Lasso regression回归分析

用R进行Lasso regression回归分析

作者头像
生信修炼手册
发布于 2019-12-19 04:31:29
发布于 2019-12-19 04:31:29
3.8K0
举报
文章被收录于专栏:生信修炼手册生信修炼手册

glmnet是由斯坦福大学的统计学家们开发的一款R包,用于在传统的广义线性回归模型的基础上添加正则项,以有效解决过拟合的问题,支持线性回归,逻辑回归,泊松回归,cox回归等多种回归模型,链接如下

https://cran.r-project.org/web/packages/glmnet/index.html

对于正则化,提供了以下3种正则化的方式

  1. ridge regression,岭回归
  2. lasso regression,套索回归
  3. elastic-net regression,弹性网络回归

这3者的区别就在于正则化的不同,套索回归使用回归系数的绝对值之和作为正则项,即L1范式;岭回归采用的是回归系数的平方和,即L2范式;弹性网络回归同时采用了以上两种策略,其正则项示意如下

可以看到,加号左边对应的是lasso回归的正则项,加号右边对应的是ridge回归的正则项。在glmnet中,引入一个新的变量α, 来表示以上公式

可以看到,随着α取值的变化,正则项的公式也随之变化

  1. alpha = 1, lasso regression
  2. alpha = 0, ridge regression
  3. alpha 位于0到1之间, elastic net regression

利用alpha的取值来确定回归分析的类型,然后就只需要关注lambda值就可以了。除此之外,还有一个关键的参数family, 用来表示回归模型的类型,其实就是因变量y的数据分布,有以下几种取值

  1. gaussian, 说明因变量为连续型变量,服从高斯分布,即正态分布,对于的模型为线性回归模型
  2. binomial, 说明因变量为二分类变量,服从二项分布,对应的模型为逻辑回归模型
  3. poisson, 说明因变量为非负正整数,离散型变量,服从泊松分布,对应的模型为泊松回归模型
  4. cox, 说明因变量为生存分析中的因变量,同时拥有时间和状态两种属性,对应的模型为cox回归模型
  5. mbinomial, 说明因变量为多分类的离散型变量,对应的模型为逻辑回归模型
  6. mgaussian, 说明因变量为服从高斯分布的连续型变量,但是有多个因变量,输入的因变量为一个矩阵,对应的模型为线性回归模型

理解这两个参数之后,就可以使用这个R包来进行分析了。以线性回归模型的的lasso分析为例,代码如下

上述代码以swiss这个数据集为例,构建了一个多元线性回归模型,而且抽取了50%的数据作为训练集,剩下的50%作为测试集,准备好数据集之后,就可以进行分析了

glmnet支持岭回归,套索回归,弹性网络回归3种正则化的回归分析,功能十分强大,更多细节请参考官方文档。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
重磅!美国T-Mobile测试诺基亚6G,研发技术布局遥遥领先!
这些年外企通信企业爱立信和诺基亚由于一些众所周知的原因,N+E在国内市场遭遇断崖式下跌。不过诺记在海外发力之后诺记展现出“东方不亮西方亮”的市场布局。现在看起来,有些沉寂多年的老牌巨头,现在要开始翻身了。
通信行业搬砖工
2025/05/12
40
重磅!美国T-Mobile测试诺基亚6G,研发技术布局遥遥领先!
华为走出的国产PLC龙头汇川10年内有望赶上西门子吗?
当年华为卖掉电气事业部错过了与西门子在电气领域交手的机会,这无疑是整个工业界的遗憾。但是华为电气走出的兄弟足够优秀,他们在工业控制各个领域大展风采,让西门子三菱一度头痛。其中最具代表性的是国产PLC龙头汇川技术,汇川由原华为电气产品经理朱兴明创建,2022年汇川营业额超230亿,历史巅峰市值超2400亿,就影响力而言无愧“国产之光”。相信未来汇川能够会成为像德国的西门子、日本的三菱、美国的罗克韦尔一样的全球工业自动化巨头。
剑指工控
2023/08/31
2.4K0
华为走出的国产PLC龙头汇川10年内有望赶上西门子吗?
汇川VS和利时,谁更有能力挑战西门子?——华为系与院所系在自动化的对决
国内自动化产业按其历史渊源可以大致的分为两个派系,即来自国企高校的院所系与在通用自动化市场摸爬滚打起来的通用系,华为系是自动化通用系的典型代表。院所系主要有来自国企的和利时、高校的浙大中控、科远、稳优等,通用系主要以和华为渊源不浅的汇川技术为代表的一众企业,除了汇川,英威腾、麦格米特都和华为电气有着千丝万缕的瓜葛。
剑指工控
2023/08/31
1.5K0
汇川VS和利时,谁更有能力挑战西门子?——华为系与院所系在自动化的对决
到底什么是“星闪”?
小枣君今天的这篇文章,既不讲芯片,也不提卫星通话。我要介绍的,是MATE60的另一个低调但重要的功能——星闪。
鲜枣课堂
2023/10/25
1.6K0
到底什么是“星闪”?
最牛上市公司创业团体,华为艾默生系,有潜力在工业领域PK西门子
华为艾默生系可谓是把这一点演绎的淋漓尽致。华为电气事业部的市场经理创建了现在名动天下的国产自动化龙头汇川技术,开发经理创建了新能源商用车控制与驱动优秀企业蓝海华腾,研发体系总裁创建了麦格米特,麦格米特是这些企业里面全球化业务最强的。当然,不只它们三个,英威腾、鼎汉科技、三晶电气等20余家上市公司都和这群人有着千丝万缕的联系。
剑指工控
2023/11/15
1.7K0
最牛上市公司创业团体,华为艾默生系,有潜力在工业领域PK西门子
全球边缘计算专利申请前10中国占9个,怎么做到的?
在北京经济技术开发区,一辆“主驾无人、副驾驶配备安全员”的无人驾驶车在行驶中(2022 年 11 月 1 日摄) 彭子洋摄 / 本刊
边缘计算
2023/02/23
4750
全球边缘计算专利申请前10中国占9个,怎么做到的?
2021年智能手机行业发展研究报告
智能手机的说法主要是针对传统的功能手机,智能手机通常指“像个人电脑一样,具有独立的操作系统,可以由用户自行安装软件、游戏等第三方服务商提供的程序,通过此类程序来不断对手机的功能进行扩充,并可以通过移动通讯网络来实现无线网络接入的这样一类手机的总称”。智能手机的发展来源于传统手机行业,2007年iPhone颠覆了整个手机市场,带来了触摸屏的浪潮,手机正式进入了智能时代。智能手机的产业链结构与功能型手机大致相同,只是环节上更加复杂,增加了操作系统平台商和应用软件开发商。在智能手机时代,全球目前主要有两大操作系统:由Google基于Linux平台创建的Android系统,苹果公司开发的iOS系统。
资产信息网
2022/04/14
1.1K0
2021年智能手机行业发展研究报告
5G风起:技术演进背后,标准必要专利扮演着怎样的角色?
导语 | 2019年9月7日,腾讯技术开放日·5G多媒体专场在腾讯滨海大厦完美落幕。来自腾讯多媒体实验室的专家们给大家带来了关于5G技术和标准的精彩分享,揭开了许多关于5G的谜团。本文是腾讯公司知识产权专家徐剑波,带来的主题为《知识产权对于5G的意义》分享整理,主要介绍了5G技术本身、5G标准,以及5G标准必要专利(SEP)。
腾讯技术开放日
2019/09/23
5.3K0
5G风起:技术演进背后,标准必要专利扮演着怎样的角色?
IM开发者的零基础通信技术入门(二):通信交换技术的百年发展史(下)
本系列文章尽量使用最浅显易懂的文字、图片来组织内容,力求通信技术零基础的人群也能看懂。但个人建议,至少稍微了解过网络通信方面的知识后再看,会更有收获。如果您大学学习过《计算机网络》这门课,那么一定不要错过本系列文章。
JackJiang
2019/04/02
7510
IEEE Fellow 张大庆:6G 时代, Wi-Fi 不再是 Wi-Fi
无处不在的感知、计算、通信世界正在到来。 作者 | 黄楠 编辑 | 陈彩娴 2018 年年初,天津一所养老院的老年公寓安装了一个 Wi-Fi 路由器和两个 Wi-Fi 小设备在房间内。张大庆教授在他北大办公室的笔记本电脑前,观察着通过 Wi-Fi实时传输过来的公寓中老人的位置、活动状态和呼吸率等,并跟房间内常规的监护设备信息进行比较。 这是张大庆在评估团队研发的基于 Wi-Fi 设备的非接触健康感知系统的准确性和稳定性。通过 Wi-Fi 的感知和通信能力,张大庆得以远程知晓老人的呼吸、睡眠和行走等实时状态。
AI科技评论
2023/04/12
8160
IEEE Fellow 张大庆:6G 时代, Wi-Fi 不再是 Wi-Fi
从解决方案到生态枢纽:5G创新时代的鼎桥通信
5G时代磅礴而来,基于5G技术的各种创新应用在短时间内快速涌现,新的产业机遇窗口已然形成。在这个浪潮中,业界眼球还是容易被聚光灯下的明星科技企业们所吸引,它们针对5G做了什么、将得到什么,往往是大家津津乐道的话题。
曾响铃
2021/11/09
3200
一场通信技术革命:无线通信模组—其应用与测试解析
无线通信模组的应用日益广泛。它作为一种创新的技术解决方案,正引领着通信行业的发展潮流。无线通信模组的推出,不仅使得各种设备之间能够实现高效的数据传输,而且在物联网、智能家居等领域起到了关键性的作用。
ICsocketgirl
2024/05/07
3610
一场通信技术革命:无线通信模组—其应用与测试解析
科普:1G到6G的最全移动通信发展史
在19世纪下半叶,有线电报和电话改变了通信的性质。几年之内,信息传递的速度从人类的速度变为光的速度。然后,在20世纪,第二次革命发生了,无线电将这些通信从电线的限制中解放出来。
通往ICT之路
2024/04/09
1.3K0
科普:1G到6G的最全移动通信发展史
IM开发者的零基础通信技术入门(三):国人通信方式的百年变迁
本系列文章尽量使用最浅显易懂的文字、图片来组织内容,力求通信技术零基础的人群也能看懂。但个人建议,至少稍微了解过网络通信方面的知识后再看,会更有收获。如果您大学学习过《计算机网络》这门课,那么一定不要错过本系列文章。
JackJiang
2019/05/05
1K0
TSN技术对于未来工业运营的影响分析
目前国内在TSN方面的素材还是比较少,但是,TSN技术却正在成为热点—然而,TSN究竟对于自动化厂商、OEM厂商、终端用户、IT厂商意味着什么?有一些人对TSN尚未了结,也有一些质疑的声音,作为对TSN技术观察已经长达3年多的0.1个专家,我觉得有必要从并非仅仅产品技术角度去剖析,以获得更深入的关注和了结。
SDNLAB
2020/02/21
9350
TSN技术对于未来工业运营的影响分析
深度分析 | 5G时代下的FPGA
FPGA是一种半定制电路,主要应用于专用集成电路,在航空航天/国防、消费电子、电子通讯等领域有着不可替代的位置。在FPGA的下游应用中,通信占据最大的细分市场,约可达60%左右。目前,5G宏基站中都就有使用FPGA,且市场需求急剧增涨,原因如下:
FPGA技术江湖
2020/12/30
1.1K0
深度分析 | 5G时代下的FPGA
李克强总理三年三提AI:拓展“智能+”,为制造业转型升级赋能
3 月 5 日上午,第十三届全国人民代表大会第二次会议上,国务院总理李克强晒出了过去一年我国人工智能产业发展的成绩单,并对 2019 年的政府工作任务做出了指导。
AI科技大本营
2019/03/15
5960
李克强总理三年三提AI:拓展“智能+”,为制造业转型升级赋能
数字中国底座,云计算竞争向技术底层、产业深处转移
2月27日,中共中央、国务院印发了《数字中国建设整体布局规划》,(以下简称《规划》)并发出通知。
科技云报道
2023/07/24
2790
数字中国底座,云计算竞争向技术底层、产业深处转移
5G 商用第三年:无人驾驶的“上山”与“下海”
新兴技术的诞生,总是在吹捧、看衰中起伏,或趋于沉寂,或蜕变重生——5G 技术也不例外。2022 年,是 5G 技术商用的第三年,经历过 2019 年的狂热,3 年后的 5G 市场回归了理性,人们不禁好奇,5G 的风,究竟吹向了哪里?
TVP官方团队
2023/01/05
5050
5G 商用第三年:无人驾驶的“上山”与“下海”
2024年,通信行业有哪些方向值得关注?
2023年,是疫情管控结束后的第一年。我们可以看到,各行各业似乎都憋了一股劲,想在这一年大干一场,弥补过去三年的损失。
鲜枣课堂
2024/01/12
2950
2024年,通信行业有哪些方向值得关注?
推荐阅读
相关推荐
重磅!美国T-Mobile测试诺基亚6G,研发技术布局遥遥领先!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档