gts, dets, recall, ap LOSS
gts | 데이터셋에서 해당Class의 bbox 갯수 number of bboxes of this class in your dataset | ground truth |
dets | 평가에 사용된 bbox the detect bboxes used to evaluate | detect bboxes |
recall | 재현율, 검출되야할 것(all GT )중 정답(TP)비율 a common metric used in the detection | recall |
ap | 평균정밀도 average precision, a common metric used in the detection | average precision |
loss

여러 Object에 대한 detector를 training할때, 두가지 종류의 loss지표를 보게 된다.
Loss type | 설명 |
loss_bbox | 예측한 bbox가 얼마나 gt에 일치하는지를 측정한 loss (대게, regression loss, L1, smooth L1 등) |
loss_cls | Classification loss 각 bbox는 object의 class 또는 “backgound”로 분류되는데, 예측한 각각 bbox의 Classification정확도를 측정한 loss (이 loss는 대게 cross entropy loss라고 불린다.) |
loss_mask |
Loss가 0일때
detector를 학습시킬때, Model은 이미지당 여러 bbox를 예측한다.
예측한 bbox의 대부분은 어떤 class에도 속하지 않는 backgound일것다.
loss함수는 이미지내에 gt bbox와 예측된 bbox에 각각 연관되어 있다.
예측한 bbox와 gt와 겹친다면 loss_bbox와 loss_cls를 계산할수 있고,
이를 통해 Model이 얼마나 잘 gt box를 예측할수 있는지를 계산할수 있다.
여기서, 일정 threshold기준으로 일부만 겹치는 경우에는 discarded된다.
반면, gt와 겹치지 않는다면, loss_bbox는 없고, loss_cls는 “backgound” class로 계산한다.
반면, gt와 겹치지 않는다면, loss_bbox는 없고, loss_cls는 “backgound” class로 계산한다.
https://stackoverflow.com/questions/70169219/what-is-total-loss-loss-cls-etc
계속 Train되면서, 매 iteration에서 찍히는 metric 이 있는데,
가장 중요한 loss 값외에
total_loss
: iteration동안 계산된 아래 각 loss들의 weighted sum (가중합, 기본가중치는 각각 1)
Fast R-CNN paper and the code.
loss_cls | ROI() head 에서 Classification loss | Box classification에 대한 loss 측정. ex) 얼마나 정확하게 모델이 예측된 box에 class를 labelling했나? Measures the loss for box classification, i.e., how good the model is at labelling a predicted box with the correct class. |
loss_box_reg | ROI() head 에서 Localisation loss | Box localisation에 loss 측정 (예측된 location Vs. 실제 location) |
Faster R-CNN paper and the code
loss_rpn_cls | RPN에서 Classification loss | “objectness” loss 측정. ex) 얼마나 정확하게 RPN(Region Proposal Network)이 anchor box들을 foreground 또는 background로 labelling했나? Measures the “objectness” loss, i.e., how good the RPN is at labelling the anchor boxes as foreground or background. |
loss_rpn_loc | RPN에서 Localisation loss | RPN(Region Proposal Network)에서 예측된 region들의 localisation에 대한 loss측정 Measures the loss for localisation of the predicted regions in the RPN. |
Faster R-CNN paper and the code.For more details on the loss (5), take a look at the Mask R-CNN paper and the code.
loss_mask | Mask head에서 Mask loss | 예측된 binary mask가 얼마나 “정확”한지 측정 Mask R-CNN paper and the code |
time | Time taken by the iteration. |
data_time | Time taken by the dataloader in that iteration. |
lr | The learning rate in that iteration. |
max_mem | : Maximum GPU memory occupied by tensors in bytes. |
s0,s1s2
cascade rcnn의 stage를 의미한다.