머신러닝 분류 모델의 성능 평가 지표 분석

1. Precision and Recall

recall(재현율) : 실제 정답들 중에서 모델이 실제로 맞춘 비율

모델을 평가하는 요소는 결국, 모델이 내놓은 답과 실제 정답의 관계로서 정의를 내릴 수 있음. 정답이 True와 False로 나누어져있고, 분류 모델 또한 True False 의 답을 내놓기때문에, 아래와 같이 case를 나눌 수 있다.

Untitled

1.1 Precision (정밀도)

정밀도란 모델이 True라고 분류한 것들 중에서 실제 True인 것들의 비율이다. 즉, 아래와 같은 식으로 표현 가능하다.

$$ (Precision) = TP~/~TP + FP $$

날씨 예측 모델이 맑다 로 예측했는데, 실제로 날씨가 맑았는지를 살펴보는 지표라고 할 수 있다.

1.2 Recall (재현율)

재현율이란 실제 True인 것들 중에서 모델이 True라고 예측한 것의 비율이다.

$$ (Recall) = TP~/~TP + FN $$

실제 날씨가 맑은 날들중, 모델이 날씨가 맑다고 맞춘 비율을 살펴보는 지표라고 할 수 있다.

1.3 Precision과 Recall

그럼 Precision(정밀도)과 Recall(재현율) 중 어떤 지표가 더 중요할까? 정답은 둘 다 중요하다 이다. 다음 예시를 살펴보자.