首页 > 英文翻译

深度学习：混淆矩阵，准确率，top1，top5，每一类的准确率

更新时间:2023-06-27 02:17:58 阅读：评论：0

深度学习：混淆矩阵，准确率，top1，top5，每⼀类的准确率⼏个概念

1）正确率（accuracy）

正确率是我们最常见的评价指标，accuracy = （TP+TN）/(P+N)，这个很容易理解，就是被分对的样本数除以所有的样本数，通常来说，正确率越⾼，分类器越好；

2）错误率（error rate)

错误率则与正确率相反，描述被分类器错分的⽐例，error rate = (FP+FN)/(P+N)，对某⼀个实例来说，分对与分错是互斥事件，所以accuracy =1 - error rate；

3）灵敏度（nsitive）

nsitive = TP/P，表⽰的是所有正例中被分对的⽐例，衡量了分类器对正例的识别能⼒；

4）特效度（specificity)

specificity = TN/N，表⽰的是所有负例中被分对的⽐例，衡量了分类器对负例的识别能⼒；

5）精度（precision）

精度是精确性的度量，表⽰被分为正例的⽰例中实际为正例的⽐例，precision=TP/（TP+FP）；

6）召回率（recall）

召回率是覆盖⾯的度量，度量有多个正例被分为正例，recall=TP/(TP+FN)=TP/P=nsitive，可以看到召回率与灵敏度是⼀样的。

TP(True Positive): 真实为0，预测也为0

FN(Fal Negative): 真实为0，预测为1

FP(Fal Positive): 真实为1，预测为0pupil的意思

TN(True Negative): 真实为1，预测也为1

FN：Fal Negative，被判定为负样本，但事实上是正样本。

FP：Fal Positive，被判定为正样本，但事实上是负样本。

TN：True Negative，被判定为负样本，事实上也是负样本。

TP：True Positive，被判定为正样本，事实上也是正样本。

accuracy（总体准确率）

：分类模型总体判断的准确率(包括了所有class的总体准确率)

precision（单⼀类准确率） : 预测为0的准确率

回归率 : 真实为0的准确率

: 真实为1的准确率

: 预测为1的准确率

: 对于某个分类，综合了Precision和Recall的⼀个判断指标，F1-Score的值是从0到1的，1是最好，0是最差

: 另外⼀个综合Precision和Recall的标准，F1-Score的变形dueto

维纳斯和阿多尼斯混淆矩阵

在机器学习中尤其是统计分类中，混淆矩阵（confusion matrix），也被称为错误矩阵（error matrix）。

矩阵的每⼀列表达了分类器对于样本的类别预测，⼆矩阵的每⼀⾏则表达了版本所属的真实类别

之所以叫做’混淆矩阵‘，是因为能够很容易的看到机器学习有没有将样本的类别给混淆了。

接着⼆分类的举例⼦：

举⼀个三分类的例⼦：

举例⼦：

top1 和top5的计算

top1----- 就是你预测的label取最后概率向量⾥⾯最⼤的那⼀个作为预测结果，如过你的预测结果中概率最⼤的那个分类正确，则预测正确。否则预测错误

top5----- 就是最后概率向量最⼤的前五名中，只要出现了正确概率即为预测正确。否则预测错误。

1 在每次迭代中计算top1和top5，然后求平均

计算代码：

输⼊是模型输出（batch_size×num_of_class），⽬标label（num_of_class向量），元组（分别向求top⼏）

def accuracy(output, target, topk=(1,)):

"""Computes the precision@k for the specified values of k"""

maxk = max(topk)

batch_size = target.size(0)

_, pred = pk(maxk, 1, True, True) # 返回最⼤的k个结果（按最⼤到⼩排序）

pred = pred.t() # 转置

correct = pred.eq(target.view(1, -1).expand_as(pred))

res = []

for k in topk:

correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)

res.append(correct_k.mul_(100.0 / batch_size))

return res

计算代码的使⽤：

改代码中计算了top1和top5

def validate(val_loader, model, criterion):

batch_time = AverageMeter()

loss = AverageMeter()

top1 = AverageMeter()

mcpstop5 = AverageMeter()

# switch to evaluate mode

model.eval()

for i, (input, target) in enumerate(val_loader):lyrics

target = target.cuda(async=True)

input_var = torch.autograd.Variable(input, volatile=True)

target_var = torch.autograd.Variable(target, volatile=True)

# compute output

output = model(input_var)

loss = criterion(output, target_var)

# measure accuracy and record loss

prec1, prec5 = accuracy(output.data, target, topk=(1, 5))

loss.update(loss.data[0], input.size(0))

top1.update(prec1[0], input.size(0))

top5.update(prec5[0], input.size(0))

an()

2 在每次迭代中计算混淆矩阵，然后求top1（即为准确率）需要注意，我们平时说的top1就是准确率

def val(model, dataloader):

'''

计算模型在验证集上的准确率等信息，⽤以辅助训练

ps英文字体

'''

opt = DefaultConfig()

# 把模型设为验证模式

model.eval()

丫杈confusion_matrix = meter.ConfusionMeter(opt.num_of_class)

for ii, data in enumerate(dataloader):

input, label = data

val_input = Variable(input, volatile=True)

val_label = Variable(label.long(), volatile=True)

if opt.u_gpu:

val_input = val_input.cuda()

知者乐水

val_label = val_label.cuda()

score = model(val_input)

confusion_matrix.add(score.data.squeeze(), label.long())

# 把模型恢复为训练模式

cm_value = confusion_matrix.value()

雅虎中文accuracy = 0

for i in range(opt.num_of_class):

怎么学法语accuracy += 100. * cm_value[i][i] / (cm_value.sum())

return confusion_matrix, accuracy

每⼀类的准确率

计算每⼀类的分类精度，进⽽求总体的平均精度是分类问题很常⽤的评价指标，当我们计算出混淆矩阵之后，需要对混淆矩阵进⾏量化分析，最明显的指标就是计算分类精度，下⾯提供⼀种计算⽅⾯，使⽤sk-learn的api

np.diag是将对⾓线的值取出来，也就是正确分类的样本数的分布，axis=1，是⾏维度，实际就是预测样本数分布，np.sum就是将预测的每类样本数进⾏求和。

nan_to_num是将部分真除之后会出现nan的数转成0值，从each_acc可以看出每类的分类精度，第⼀类是1，第⼆个bird没有正确分类的个数，第三个是2/3，得出每类精度之后再求平均精度。

总结

Specificity，Recall，Precision等只是计算某⼀分类的特性，⽽Accuracy和F1-Score这些是判断分类模型总体的标准。我们可以根据实际需要，得出不同的效果。

本文发布于:2023-06-27 02:17:58，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/90/158902.html

下一篇：[机器学习笔记]混淆矩阵（ConfusionMatrix）

标签：分类矩阵预测混淆精度模型

留言与评论（共有 0 条评论）