机器学习中,ROC曲线和precision-recall曲线有什么区别?
0 797
1

如何区分它们的应用场景?

收藏
2021-01-13 17:06 更新 天明 •  1292
共 1 个回答
高赞 时间
0

ROC曲线所代表的内容与precision-recall曲线所代表的内容之间有着非常重要的区别。 请记住,ROC曲线代表灵敏度和假阳性率之间的关系。灵敏度是召回率(recall)的另一个名称,但假阳性率不是准确率。 precision-recall是对所有样本(其真实类标签为1)的估计值为1的概率的度量。它是一个衡量有多少阳性样本被确认为阳性的指标。 特异性是在所有样本的真实类标签为0的情况下,估计值为0的概率的度量。它是一种衡量有多少阴性样本被鉴定为阴性的指标。 另一方面,精确度是不同的。假设你的分类器表示为阳性,则此度量标准衡量的是样本为真实阳性类别的概率。它衡量分类器预测为正的样本中有多少确实是正的。 请注意,当正类的基本概率或先验概率发生变化时,这种情况会发生变化。这意味着精度取决于正类的稀有程度。换言之,当正类别比负类别更主要时,就使用它。 所以,如果你的问题涉及到大海捞针的情况的时候,例如:正类样本与负类样本相比是非常罕见的,那么使用precision-recall曲线。 否则,请使用ROC曲线,因为无论正类样本(重要的稀有分类)的先验概率如何,ROC曲线均保持不变。

收藏
2021-01-13 17:17 更新 Lisa •  1800