정확성(Accuracy)
정확성은 분류 모델 평가를 위한 측정항목 중 하나 입니다. 정확성은 일반적으로 다음과 같이 정의합니다.
앞에서 다룬 이진 분류에서는 다음과 같이 양성과 음성을 기주으로 정확성을 표현 할 수도 있습니다.
클래스 불균형 데이터 세트(Class Imbalanced Data Set)
악성으로 분류된 종양(Positive Class) 또는 양성으로 분류된 종양(Negative Class)을 예로 들어 모델 100개의 정확성을 계산해 보겠습니다.
위의 정확성 계산에 따르면 91%라는 높은 정확성을 나타내는 것을 확인할 수 있습니다. 하지만 정말 이 모델이 좋은 모델일까요?
모델은 양성 종양 91개 중 90개를 양성으로 정확히 식별합니다. 하지만 악성 종양 9개 가운데 1개만 악성으로 식별합니다. 악성 종양 9개 중 8개가 미확진 상태로 남았다는 것은 정말 형편없는 예측 결과 입니다.
이와 같이 클래스 불균형 데이터 세트(Class Imbalanced Data Set)를 사용하면 양성 라벨 수와 음성 라벨 수가 상당히 다르므로 정확성만으로 모든 것을 평가 할 수 없습니다.
'Muchine Learning > Google MLCC' 카테고리의 다른 글
11-4 분류: ROC, AUC (0) | 2018.09.07 |
---|---|
11-3 분류: 정밀도와 재현율(Precision and Recall) (0) | 2018.09.07 |
11-1 분류: 임계값(Threshold), 참(True)과 거짓(False), 양(Positive)과 음(Negative) (0) | 2018.09.06 |
10-1 로지스틱 회귀(Logistic Regression): 확률 계산 & 로그 손실 (0) | 2018.09.06 |
09-2 단순성을 위한 정규화: 람다 (0) | 2018.09.06 |