(create: ‘20.6.30, update: ‘20.8.12)

reference:

모델 평가와 성능 향상

(source: https://github.com/sungalex/aiqa/blob/master/model-evaluation-and-improvement.ipynb)

  • Train/Validation/Test Data

    validataion_set

  • 교차 검증(Cross Validation)

    cross-validation

  • K-겹 교차 검증(K-Fold Cross Validation)

    k-fold

  • 평가 지표 및 측정

최종 목표를 기억하라 : 학습되지 않은 새로운 데이터에서의 예측 성능을 높이는 것이 중요하다.

  • 오차 행렬(Confusion matrics)

    • TN : True Negative (실제 Negative를 Negative로 정확히 예측한 데이터)
    • FN : False Negative (실제 Positive를 Negative로 잘못 예측한 데이터)
    • FP : False Positive (실제 Negative를 Positive로 잘못 예측한 데이터)
    • TP : True Positive (실제 Positive를 Positive로 정확히 예측한 데이터)

    confusion_matrix

  • 정확도, 정밀도, 재현율, F-점수

    • 정확도(Accuracy)와 오차행렬(Confusion_Matrix) 관계

      accuracy-cm

    • 정밀도, 재현율, F-점수

      Precision-Recall