可靠性定义为在特定环境中指定时间段内无故障软件运行的概率。
执行可靠性测试是为了确保软件是可靠的,它满足其目的,在给定的环境中指定的时间量,并能够呈现无故障运行。
在这个机械化的世界里,现在人们盲目地相信任何软件。无论软件系统显示出什么结果,人们都相信该软件将永远是正确的。事实上,这是我们所有人都犯的一个常见错误。
用户认为显示的数据是正确的,软件将始终正确运行。这就是需要进行可靠性测试的地方。
根据 ANSI,软件可靠性定义为在特定环境中指定时间段内软件无故障运行的概率。
如果软件产品在特定环境中以无故障方式运行特定时间段,则称为可靠软件。
软件可靠性将减少软件开发过程中的故障。在电子设备或机械仪器中,软件不可能有“磨损”,这里的“磨损”只是由于软件系统中的“缺陷”或“错误”而发生。
在当今世界,软件应用程序正被用于我们生活的方方面面,包括医疗保健、政府部门、电信等。
因此,我们需要有用户可以依赖的准确数据。可靠性测试涉及软件的质量和产品的标准化。如果我们能够重复测试用例,并且如果我们始终获得相同的输出,那么我们就说该产品是“可靠的”。
执行可靠性测试是为了确保软件在给定环境中的指定时间内是可靠的,满足其目的,并且能够呈现无故障运行。
以下是我们使用此测试的场景:
测试用例的设计方式应确保软件的全面覆盖。测试用例应该定期执行,以便我们可以交叉检查当前结果和以前的结果,并验证它们之间是否有任何差异。如果它显示相同或相似的结果,则可以认为该软件是可靠的。
此外,我们可以通过在特定时间段内执行测试用例来测试可靠性,并检查它是否在该特定时间段后正确显示结果而没有任何故障。在进行可靠性测试时,我们必须检查内存泄漏、电池电量不足、网络不足、数据库错误等环境限制。
下面列出了一些衡量软件可靠性的基本类型。
考虑以下我们正在测试功能的情况,比如说在上午 9:30 并在下午 1 点再次测试相同的功能。稍后,我们比较两个结果。我们在结果中得到了高度的相关性。然后我们可以说测试是“可靠的”。通常,0.8 或更高的可靠性意味着系统可以被认为是高度可靠的产品。
在这里,非常重要的是要注意,如果我们在一个测试用例中有 10 个步骤,则测试的长度保持不变,那么下次执行测试的步骤数将保持不变。
考虑参加“智商测试”并获得 144 分的人的特定示例。6 个月后,他参加了同样的“智商测试”,得到 68 分。在这种情况下,他不能被视为“可靠”的来源。
之所以这样称呼,是因为测试人员同时以两种形式进行测试。
Inter-Rater Reliability 也称为 Inter-Observer 或 Inter-Coder Reliability。它是一种特殊类型的可靠性,由多个评估者或法官组成。它处理不同评级者/观察者提出的评级的一致性。
例如,考虑参加歌唱比赛并从多个评委那里获得 9、8、9(满分 10)分的参赛者。这个分数可以被认为是“可靠的”,因为它们相当一致。但是,如果他的得分是 9、3、7(满分 10),那么它就不能被认为是“可靠的”。
注意:这些评分将在很大程度上取决于不同评委/评分者之间的普遍共识。一旦你完成了一系列观察,那么你就可以确定分数之间存在某种稳定性,并且在那段时间之后,我们可以说它们是一致的。
因此,评分稳定性是对多个观察者的衡量。值得注意的是,在讨论评估者间的可靠性时,观察者的技能也起着重要作用。为了提高评估者间的可靠性,评估者需要培训或适当的指导。
考虑上面的 Excel 表,查看两个不同的评分者 Rater1 和 Rater2 对 12 个不同项目的评分。评分者 1 已在评分板上独立评分。在这里,使用记分板,我们现在将计算两个评分者之间的一致性百分比。这称为两个评分者之间的评分者间可靠性或评分者间一致性。
在第三列中,如果评分者给出的分数匹配,我们将输入“1”。如果分数匹配,我们将给出“0”。之后,我们将在列中找到数字“1”和“0”。这里是 8。
‘1’的数量=8
项目总数=12
同意百分比 = (8/12) *100 =67%。67% 不算多。评分者需要有更多的共识,以便他们可以相应地讨论和改进结果。
下面讨论了各种类型的可靠性测试以供您参考:
此测试确定适用性,即它测试应用程序是否按预期用途执行。在这里,它将检查应用程序的互操作性,以测试它与其他组件以及与应用程序交互的系统。
它确保了系统在 Beta 测试期间检查是否没有发现错误的准确性。
除此之外,它还测试某种安全性和合规性。安全测试与防止有意或无意地未经授权访问应用程序有关。在合规性方面,我们将检查应用程序是否遵循某些标准,例如标准、规则等。
负载测试将检查系统与竞争系统或性能相比的性能。它还基于正在使用系统的并发用户数以及系统对用户的行为。
系统必须以更短的响应时间(例如 5 秒)响应用户命令并满足用户的期望。
在回归测试中,我们将检查系统是否运行良好,以及是否没有由于在软件中添加新功能而引入错误。当错误已修复并且测试人员需要再次测试时,也会执行此操作。
在 SDLC(软件开发生命周期)的不同阶段,用户可能会提出许多关于产品未来的问题,例如“它们是否可靠”。对于这些问题,我们需要有一个明确的解决方案。通过适当的模型,我们可以预测产品。
两种类型的模型包括:
在预测测试中,我们使用历史数据、统计数据以及机器和学习来预测结果。我们只需要写一份报告。在预测模型中,我们只能得到一些历史信息。使用此信息,我们可以构建散点图并绘制现有历史数据的外推线,我们可以预测即将到来的数据。
这种类型的模型在开发或测试阶段本身之前执行。在 Estimation Testing 中,除了使用历史数据外,我们还会使用当前数据。在这里,我们可以预测产品在当前或未来时间的可靠性。这种类型的测试在软件开发生命周期的最后阶段执行。
测试人员需要确定软件的可靠性估计。这将导致在软件可靠性中使用各种工具。
市场上有各种用于测量软件可靠性的工具,其中一些工具如下所述:
CASRE(计算机辅助软件可靠性评估工具):这不是免费软件,我们需要购买它。
CASRE 可靠性测量工具基于现有的可靠性模型构建,有助于更好地估计软件产品的可靠性。该工具的 GUI 提供了对软件可靠性的更好理解,并且非常易于使用。
在测试过程中,它可以帮助用户在使用一组故障数据时了解系统的可靠性是在增加还是减少。Carse 通过绘制失败次数与测试间隔时间的关系来提供 2D 视图,因此用户可以获得表示系统的图表,如下图所示。
其他用于测试可靠性的工具包括 SOFTREL、SoRel(软件可靠性分析和预测)、WEIBULL++ 等。
与其他形式的测试相比,可靠性测试的成本很高。因此,为了经济高效地进行测试,我们需要有一个适当的测试计划和测试管理。
在 SDLC 中,可靠性测试起着重要的作用。如上所述,使用可靠性指标将为软件带来可靠性并预测软件的未来。很多时候,如果软件的复杂度很高,软件的可靠性就很难获得。
谢谢大家关注,转发,点赞和点在看。