gts, dets, recall, ap LOSS

Published by onesixx on

gts데이터셋에서 해당Class의 bbox 갯수
number of bboxes of this class in your dataset
ground truth
dets평가에 사용된 bbox
the detect bboxes used to evaluate
detect bboxes 
recall재현율, 검출되야할 것(all GT )중 정답(TP)비율
a common metric used in the detection
average precision, a common metric used in the detection
average precision



여러 Object에 대한 detector를 training할때, 두가지 종류의 loss지표를 보게 된다.

Loss type설명
loss_bbox예측한 bbox가 얼마나 gt에 일치하는지를 측정한 loss
(대게, regression loss, L1, smooth L1 등)
loss_clsClassification loss
각 bbox는 object의 class 또는 “backgound”로 분류되는데, 예측한 각각 bbox의 Classification정확도를 측정한 loss
(이 loss는 대게 cross entropy loss라고 불린다.)

Loss가 0일때

detector를 학습시킬때, Model은 이미지당 여러 bbox를 예측한다.
예측한 bbox의 대부분은 어떤 class에도 속하지 않는 backgound일것다.
loss함수는 이미지내에 gt bbox와 예측된 bbox에 각각 연관되어 있다.

예측한 bbox와 gt와 겹친다면 loss_bbox와 loss_cls를 계산할수 있고,
이를 통해 Model이 얼마나 잘 gt box를 예측할수 있는지를 계산할수 있다.
여기서, 일정 threshold기준으로 일부만 겹치는 경우에는 discarded된다.

반면, gt와 겹치지 않는다면, loss_bbox는 없고, loss_cls는 “backgound” class로 계산한다.

반면, gt와 겹치지 않는다면, loss_bbox는 없고, loss_cls는 “backgound” class로 계산한다.

계속 Train되면서, 매 iteration에서 찍히는 metric 이 있는데,

가장 중요한 loss 값외에

total_loss: iteration동안 계산된 아래 각 loss들의 weighted sum (가중합, 기본가중치는 각각 1)

Fast R-CNN paper and the code.

loss_clsROI() head 에서 Classification lossBox classification에 대한 loss 측정.
ex) 얼마나 정확하게 모델이 예측된 box에 class를 labelling했나?
Measures the loss for box classification, i.e., how good the model is at labelling a predicted box with the correct class.
loss_box_regROI() head 에서 Localisation lossBox localisation에 loss 측정
(예측된 location Vs. 실제 location)

Faster R-CNN paper and the code

loss_rpn_clsRPN에서 Classification loss“objectness” loss 측정.
ex) 얼마나 정확하게 RPN(Region Proposal Network)이 anchor box들을 foreground 또는 background로 labelling했나?
Measures the “objectness” loss, i.e., how good the RPN is at labelling the anchor boxes as foreground or background.
Localisation loss
RPN(Region Proposal Network)에서 예측된 region들의 localisation에 대한 loss측정
Measures the loss for localisation of the predicted regions in the RPN.

Faster R-CNN paper and the code.For more details on the loss (5), take a look at the Mask R-CNN paper and the code.

loss_maskMask head에서
Mask loss
예측된 binary mask가 얼마나 “정확”한지 측정
Mask R-CNN paper and the code
timeTime taken by the iteration.
data_timeTime taken by the dataloader in that iteration.
lrThe learning rate in that iteration.
max_mem: Maximum GPU memory occupied by tensors in bytes.


cascade rcnn의 stage를 의미한다.



Categories: vision


Blog Owner


Inline Feedbacks
View all comments
Would love your thoughts, please comment.x