机器学习算法的评价指标可以根据不同任务的特点和需求进行选择,以下是一些常用的评价指标:
分类任务的评价指标:
- 准确率(Accuracy):预测正确的样本数占总样本数的比例。
- 精确率(Precision):真正例数占所有预测为正例的样本数的比例。
- 召回率(Recall):真正例数占所有真实为正例的样本数的比例。
- F1值(F1-score):精确率和召回率的调和平均数,用于综合评价模型的性能。
- AUC-ROC:ROC曲线下面积,用于评价二分类模型的性能。
回归任务的评价指标:
- 均方误差(MSE):预测值与真实值之间差值的平方和的均值。
- 均方根误差(RMSE):均方误差的平方根。
- 平均绝对误差(MAE):预测值与真实值之间差值的绝对值的均值。
- R方值(R2-score):预测值与真实值之间的相关系数的平方,用于衡量模型对数据的拟合程度。
聚类任务的评价指标:
- 轮廓系数(Silhouette Coefficient):用于衡量样本距离最近的簇与其它簇的距离,值越大表示聚类效果越好。
- Calinski-Harabasz指数:用于衡量簇内的样本之间的距离,簇间的距离,值越大表示聚类效果越好。
推荐任务的评价指标:
- 准确率(Precision):推荐列表中真正被用户喜欢的物品数占总推荐物品数的比例。
- 召回率(Recall):推荐列表中真正被用户喜欢的物品数占用户喜欢的所有物品数的比例。
- F1值(F1-score):精确率和召回率的调和平均数,用于综合评价模型的性能。