首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化

本文使用了 R 语言中的逻辑回归(logistic)模型,利用国泰安数据库中的103个上市公司的数据进行信用风险建模,其中包括51个正常公司和52个ST公司。...此外,我们还对模型的预测能力进行了评价,绘制了混淆矩阵和ROC曲线,得到了较高的AUC值,表明模型具有较好的预测效果和识别能力。...roc曲线靠近图的左上方,说明模型对客户是否流失具有较好的识别能力,因此该模型可以作为预警系统。...重新建立的模型同样进行了混淆矩阵和ROC曲线的评价,结果显示新模型依然具有较好的预测效果和识别能力。残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。...从AUC的值来看,达到了0.8,因此可以认为模型具有较好的预测效果,同时可以看到roc曲线靠近图的左上方,说明模型对客户是否流失具有较好的识别能力,因此该模型可以作为预警系统。

25900
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言:逻辑回归ROC曲线对角线分析过程及结果

    p=19018 之前我们讨论了使用ROC曲线来描述分类器的优势,有人说它描述了“随机猜测类别的策略”,让我们回到ROC曲线来说明。...考虑一个非常简单的数据集,其中包含10个观测值(不可线性分离) 在这里我们可以检查一下,确实是不可分离的 plot(x1,x2,col=c("red","blue")[1+y],pch=19) 考虑逻辑回归...reg = glm(y~x1+x2,data=df,family=binomial(link = "logit")) 我们可以使用我们自己的roc函数 roc=function(s,print...我们考虑另一个函数来绘制ROC曲线 y=roc(x)lines(x,y,type="s",col="red") ?...我们确实有一个“完美的分类器”(曲线靠近左上角) ? ? 有错误。那应该是下面的情况 ? 在10%的情况下,我们可能会分类错误 ? 更多的错误分类 ? ? 最终我们有对角线 ? ?

    1.2K20

    ROC曲线的理解

    大家好,又见面了,我是你们的朋友全栈君。 ROC曲线的理解和python绘制ROC曲线 ROC曲线的理解 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。...ROC曲线 对于一个特定的分类器和测试数据集,显然只能得到一个分类结果,即一组FPR和TPR结果。...AUC值 AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。...ROC曲线的优势 ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。...可以明显的看出,ROC曲线基本保持原貌,而Precision-Recall曲线则变化较大。 计算AUC 第一种方法:AUC为ROC曲线下的面积,那我们直接计算面积可得。面积为一个个小的梯形面积之和。

    57410

    ROC曲线的通俗理解

    大家好,又见面了,我是你们的朋友全栈君。 在准备机器学习导论课程考试的过程中,发现自己根据西瓜书上的讲解总是也理解不上去ROC曲线的含义。...当样本足够多时,折线就近似为圆滑的曲线,类似于这个样子【2】: 从这个图上看,分类器A的结果肯定比分类器B要好。这个就是AOC曲线以及它的含义,通过这样的分析理解,感到自己明白了很多。...附上绘图所使用的MATLAB程序: %code type:MATLAB %绘制ROC曲线,demo clear all; close all; clc; %测试样本数据 samples=[...参考文献: 【1】dzl_ML.机器学习之分类器性能指标之ROC曲线、AUC值.博客园,https://www.cnblogs.com/dlml/p/4403482.html.20150408,20181105.... 【2】Dengchao.博客园,ROC曲线.https://www.cnblogs.com/cdeng/p/3471527.html.20131212,20181105.

    99911

    数据分析之Logistic回归

    所有的线性回归分析中,因变量的类型都是连续变量,如果需要预测的变量类型为分类变量,则需要采用回归分析中的Logistic回归。 ?...文/黄成甲 Logistic回归是针对因变量为分类变量而进行回归分析的一种统计方法,属于概率型非线性回归。...对数变换的目的就是将非线性问题转换为线性问题,这样就能够使用线性回归相关理论和方法来解决非线性回归的问题。 分类变量包括二分类和多分类。...二分类Logistic回归,也就是因变量只有两个分类值:1和0,对应“是”和“否”,或者“发生”,和“未发生”这样的状态。在模型预测中,我们不是直接得到分类值1和0,而是以发生的可能性大小来衡量。...Logistic回归应用场景

    81210

    理解逻辑回归中的ROC曲线和KS值「建议收藏」

    /负样本实际数 3.4 ROC,AUC,KS曲线 逻辑回归得到的结果是概率,那么就要取阈值来划分正负,这时候,每划一个阈值,就会产生一组FPR和TPR的值,然后把这组值画成坐标轴上的一个点,这样,当选取多组阈值后...,就形成了ROC曲线(每次选取一个不同的阈值,我们就可以得到一组FPR和TPR,即ROC曲线上的一点) ROC曲线是评判一个模型好坏的标准,AUC值就是ROC曲线下方的面积。...参考资料 对ROC和KS曲线的理解 https://blog.csdn.net/yaoqsm/article/details/78334920 真正率、假正率、真负率 https://blog.csdn.net.../zyq11223/article/details/79085711 ROC曲线与KS曲线的理解 https://www.jianshu.com/p/07577d1f9fff 关于模型检验的ROC值和KS...值的异同_ROC曲线和KS值 http://cda.pinggu.org/view/21012.html 通俗理解线性回归 https://blog.csdn.net/alw_123/article/details

    2.7K20

    R语言ROC曲线下的面积-评估逻辑回归中的歧视

    p=6310 在讨论ROC曲线之前,首先让我们在逻辑回归的背景下考虑校准和区分之间的区别。 良好的校准是不够的 对于模型协变量的给定值,我们可以获得预测的概率。...基本语法是指定回归类型方程,左侧是响应y,右侧是包含拟合概率的对象: roccurve roc(y~preppr) 然后可以使用绘制roc对象 这给了我们ROC图(见前面的图)。...请注意,这里因为我们的逻辑回归模型只包含一个协变量,如果我们使用roc(y~x),ROC曲线看起来完全相同,即我们不需要拟合逻辑回归模型。这是因为只有一个协变量,拟合概率是唯一协变量的单调函数。...ROC曲线,其中预测因子与结果无关 ROC曲线下面积 总结模型辨别能力的一种流行方式是报告ROC曲线下的面积。...我们已经看到具有辨别能力的模型具有更接近图的左上角的ROC曲线,而没有辨别能力的模型具有接近45度线的ROC曲线。因此,曲线下面积从1(对应于完美辨别)到0.5(对应于没有辨别能力的模型)。

    1.1K30

    spss logistic回归分析结果如何分析

    spss logistic回归分析结果如何分析 如何用spss17.0进行二元和多元logistic回归分析 一、二元logistic回归分析 二元logistic回归分析的前提为因变量是可以转化为...下面以医学中不同类型脑梗塞与年龄和性别之间的相互关系来进行二元logistic回归分析。...图 1-1 第二步:打开“二值Logistic 回归分析”对话框: 沿着主菜单的“分析(Analyze)→回归(Regression)→二元logistic(Binary Logistic)”的路径...二、多项(多元、多分类、Multinomial)logistic回归分析 前面讲的二元logistic回归分析仅适合因变量Y只有两种取值(二分类)的情况,当Y具有两种以上的取值时,就要用多项logistic...下面就可以进行多项logistic回归分析了。如图 2-4打开多项logistic回归分析对话框(图2-5)。

    2.2K30

    SPSS—回归—二元Logistic回归案例分析

    数据分析真不是一门省油的灯,搞的人晕头转向,而且涉及到很多复杂的计算,还是书读少了,小学毕业的我,真是死了不少脑细胞, 学习二元Logistic回归有一段时间了,今天跟大家分享一下学习心得,希望多指教...推断各参数βj是否为0,其中u= bj / Sbj, X的平方=(bj / Sbj), Sbj 为回归系数的标准误 这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样...,二元logistic回归是指因变量为二分类变量是的回归分析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当中,这个是不能够接受的,所以,可以先将目标概率做Logit...变换,这样它的取值区间变成了整个实数集,再做回归分析就不会有问题了,采用这种处理方法的回归分析,就是Logistic回归 设因变量为y, 其中“1” 代表事件发生, “0”代表事件未发生,影响y的 n个自变量分别为...,我们需要进行随机抽样,来进行二元Logistic回归分析,上图中的“0”表示没有拖欠贷款,“1”表示拖欠贷款,接下来,步骤如下: 1:设置随机抽样的随机种子,如下图所示: 选择“设置起点”选择

    3.3K30

    GraphPad prism 生存分析和ROC 曲线操作步骤解析

    (d),试分析两种浓度的生存率。...3)结果图3 二、ROC 曲线  原理及意义  ①受试者工作特征曲线: receiver operating characteristic curve,ROC 曲线,又称为感受性曲线(sensitivity...③ROC 曲线图片: 采用真阳性率和假阳性率出图; Y:真阳性率 (Sen) ,X:假阳性率 (1-Spe) ;坐标轴上的率值由 0~1。...④ROC 主要作用: 判断指标对疾病的诊断作用; ROC 曲线下面积 (AUC) 越大,诊断价值越高(灵敏度、特异度)  软件操作 1.打开软件,选择左侧 New Table & Graph 中的Column...3.输入数据,完善表格  实例分析  现有经过金标准诊断的18名正常人及18名患者的某项指标检验结果。试绘制ROC曲线。

    17.6K11

    ROC曲线的含义以及画法

    得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。其主要分析工具是一个画在二维平面上的曲线——ROC 曲线。...知道阈值取到最大,二维空间中找到了所有与混淆矩阵对应的点,我们把这些点连起来就得到了我们所需要的ROC曲线 由上可知,ROC曲线的横坐标和纵坐标其实是没有相关性的,所以不能把ROC曲线当做一个函数曲线来分析...为什么使用ROC曲线? 因为ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。...第二个点:(1,0),即FPR=1,TPR=0,类似地分析可以发现这是一个最糟糕的分类器,因为它成功避开了所有的正确答案。...经过以上的分析,ROC曲线越接近左上角,该分类器的性能越好。 AUC的含义 AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。

    1.2K10

    roc曲线的意义_Pre Rec ROC PR「建议收藏」

    绘制ROC曲线和PR曲线都是选定不同阈值,从而得到不同的x轴和y轴的值,画出曲线。 在 ROC 空间,ROC 曲线越凸向左上方向效果越好,但是,PR 曲线是右上凸效果越好。...当正负样本比例差距不大时,ROC和PR的趋势是差不多的,当正负样本比例差距很大时,ROC效果依然看似很好,但是PR曲线则会表现的比较差。...所以,PR曲线在正负样本比例悬殊较大时,更能反映分类器的性能。 当正负样本分布发生变化时,ROC 曲线的形状能够基本保持不变,而 P-R 曲线的形状一般会发生较剧烈的变化。...若选择不同的测试集,P-R 曲线的变化就会非常大,而 ROC 曲线则能够更加稳定地反映模型本身的好坏。 所以,ROC 曲线的适用场景更多,被广泛用于排序、推荐、广告等领域。...wdmad:机器学习之类别不平衡问题 (2) —— ROC和PR曲线​zhuanlan.zhihu.com (分析了ROC曲线的优缺点,以及ROC和PR的使用场景) ROC曲线和PR(Precision-Recall

    1.1K10

    roc曲线的意义_【科研助手】ROC曲线在医学诊断类稿件中的应用「建议收藏」

    而稿件中的ROC曲线应用是否合理及数据逻辑能否行得通,还需认真分析。今天,小编就跟大家聊一聊ROC曲线在医学诊断类稿件中的应用。...而ROC曲线无此限制要求,即允许有中间状态,可以将试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。那么,什么情况下可以应用ROC曲线?...首先,我们应该明确ROC曲线的绘制包括参数法和非参数法2种;非参数法没有条件限制,适用于任何诊断试验的ROC曲线绘制,常见的软件有SPSS、SAS,绘制出来的曲线为顶点较多的折线;参数法是假设患者和非患者的试验结果属于正态分布...,常见于一些专业的ROC分析软件,如ROCKIT,绘制出来的是光滑的曲线。...参考文献 [1]赵瑞珩.ROC曲线评价血清CA125、CA199和CEA对卵巢癌的诊断价值[J].中国实验诊断学,2015(11):1954-1955.[2]冯广龙,姜慧杰.ROC曲线分析在医学影像学诊断中的价值

    3.1K30

    “数据分析”-前沿之“Logistic回归的应用”!

    指尖上的数据|“数据分析”- 前沿之“Logistic回归的应用”(原创)! 作者:豹伯 导言: 化繁为简:将复杂理论简单化,将简单理论说极简化。 触类旁通:深度挖掘一个行业,以一生二,二生万业。...感谢您关注昊睿咨询今天“指尖上的数据”频道。 前面详细介绍了《指尖上的数据|“数据分析”之回归分析!》,今天介绍一下在前沿应用比较多的回归方法,Logistic回归的实际应用。...Logistic回归可能对某些人来说并不陌生,普通的分析工具做Logistic回归并不容易,对数据的形式和参数的要求很高,但是在Python环境下,结合人工智能的算法和工具实现起来只要“两句代码”。...回归目前是人工智能的基础,为了建立合理的回归模型,机器需要对大量的数据进行分析,这个过程定义为学习;为了保证模型的正确性,可以通过必要的数据进行验证,以确保误差的最小化,这个过程定义为测试;当模型建立符合要求后...(代码太长,太复杂,只放上结果图片) 通过图片可以看到,经过神经网络的自我迭代学习,原来的分界线已经发生了变化,同时突破了线性的限制,变成了曲线。原始的200组数据被划分得更精确。

    96700

    logistic回归与cox回归的区别

    logistic回归 logistic回归与线性回归并成为两大回归。...条件logistic回归用于配对资料的分析,非条件logistic回归用于非配对资料的分析,也就是直接随机抽样的资料。...---- cox回归 cox回归的因变量就有些特殊,因为他的因变量必须同时有2个,一个代表状态,必须是分类变量,一个代表时间,应该是连续变量,只有同时具有这两个变量,才能用cox回归分析。...cox回归主要用于生存资料的分析,生存资料至少有两个结局变量,一是死亡状态,是活着还是死亡?二是死亡时间,如果死亡,什么时间死亡?如果活着,从开始观察到结束时有多久了?...所以有了这两个变量,就可以考虑用cox回归分析。 ---- 版权属于:。。。

    2.3K30

    批量COX回归生存分析图,指定挑选lncRNA基因,森林图,ROC曲线打包给你

    大家好,我是生信技能树学徒,昨天我们绘制了基因全景图,今天来做一下COX回归分析 数据准备 回归分析需要用到表达矩阵和样本信息,文件的下载仍旧是来源于XENA (点评:其实也可以是突变与否的信息,或者其它组学信息...Tumor_Sample_Barcode" phenoData[1:5, 1:5] save( phenoData, file = Rdata_file ) }else{ load( Rdata_file ) } 回归分析前数据准备...status', 'time', 'age_group') pheno$ID <- toupper(pheno$ID) dim(pheno) head(pheno) t_exp[1:4, 1:4] COX回归分析...ROC曲线 library(lars) library(glmnet) x <- t(log2(t_exp[overgene,] + 1)) y <- survival_dat$status cv_fit...= TRUE, iid = TRUE) ) plot(ROC, time = 60, col = "blue", add = F) plot(ROC, time

    6.6K21

    限制性立方样条(RCS)的列线图怎么画?

    既然logistic回归没问题,那COX回归自然也是没问题的!...Cox回归列线图(nomogram)的4种绘制方法 Logistic回归列线图的4种绘制方法 列线图的本质 一文搞懂临床预测模型的评价!...区分度评价:C-statistic的计算 C-statistic的显著性检验 临床预测模型之二分类资料ROC曲线绘制 临床预测模型之生存资料的ROC曲线绘制 R语言画多时间点ROC和多指标ROC曲线 生存资料...ROC曲线的最佳截点和平滑曲线 ROC(AUC)曲线的显著性检验 ROC阳性结果还是阴性结果?...ROC曲线纯手工绘制 R语言计算AUC(ROC曲线)的注意事项 多指标联合诊断的ROC曲线 净重新分类指数NRI计算 综合判别改善指数IDI的计算 二分类资料的DCA决策曲线分析 生存资料的决策曲线分析

    1.8K40

    回归评估指标——准确率、精准率、召回率、F1、ROC曲线、AUC曲线

    分类问题评估指标: 准确率 – Accuracy 精确率(差准率)- Precision 召回率(查全率)- Recall F1分数 ROC曲线 AUC曲线 回归问题评估指标: MAE MSE 分类问题图解...ROC 曲线的阈值问题 与前面的 P-R 曲线类似,ROC 曲线也是通过遍历所有阈值 来绘制整条曲线的。...如果我们不断的遍历所有阈值,预测的正样本和负样本是在不断变化的,相应的在 ROC 曲线图中也会沿着曲线滑动。 ? 如何判断 ROC 曲线的好坏?...我们发现:无论红蓝色样本比例如何改变,ROC 曲线都没有影响。 ? 3. AUC(曲线下的面积) 为了计算 ROC 曲线上的点,我们可以使用不同的分类阈值多次评估逻辑回归模型,但这样做效率非常低。...曲线下面积的一种解读方式是看作模型将某个随机正类别样本排列在某个随机负类别样本之上的概率。以下面的样本为例,逻辑回归预测从左到右以升序排列: ?

    24.7K22
    领券