728x90
재현율
- 실제양성 + 거짓음성: 즉 분류기 f가 실제값이 True인 샘플에 대해서 내린 모든 판단의 경우의 수 중에서 실제 정답의 비를 의미한다.
정밀도
- 분류기 f가 실제값이 True인 샘플에 대해서 내린 모든 판단의 경우의 수 중에서 실제 정답의 비를 의미한다.
정확도
- 모든 샘플에서 정확히 분류한 샘플의 수가 차지하는 비율
F1
- 재현율과 정밀도의 조화평균
데이터 균형 전 결과
데이터를 균형맞췄을때 값이 왜 이렇게 변화하는지 서술
펄서 예측 데이터셋의 데이터들은 90.8%정도만 일반 별이고 9.2%만 펄서이다. 이 떄문에 무조건 펄서가 아니라고 답하는 방법만으로 90%이상의 정확도를 쉽게 달성할 수 있다. 그래서 데이터 균형이 필요하다. 데이터 셋에서 별과 펄서가 비슷한 수가 되도록 데이터 비율을 바꾸어 출현빈도가 낮은 펄서를 학습하는 기회를 늘려보는 것 이다. 균형잡힌 데이터로 신경망을 학습시키면 정확도 정밀도 재현율 F1값 중 재현율은 크게 좋아졌다. 재현율 상승에 힘입어 F1값도 높아졌다. 데이터가 균형을 잡으면서 정확도가 하락한것 같지만 실제로는 성능이 크게 좋아진 결과이다.
728x90
'Computer Science > AI' 카테고리의 다른 글
회귀 분석: 전복의 고리 수 추정 신경 (0) | 2020.09.23 |
---|---|
회귀분석: 전복의 고리 수 추정 신경망 (0) | 2020.09.16 |
XOR을 위한 다층 퍼셉트론 (0) | 2020.09.11 |
인공지능 개론 (2) | 2020.09.02 |
댓글