본문 바로가기
Computer Science/AI

천체의 펄서 예측 신경망

by HaningYa 2020. 9. 28.
728x90

재현율

재현율

  • 실제양성 + 거짓음성: 즉 분류기 f가 실제값이 True인 샘플에 대해서 내린 모든 판단의 경우의 수 중에서 실제 정답의 비를 의미한다.

정밀도

정밀도

  • 분류기 f가 실제값이 True인 샘플에 대해서 내린 모든 판단의 경우의 수 중에서 실제 정답의 비를 의미한다.

정확도

  • 모든 샘플에서 정확히 분류한 샘플의 수가 차지하는 비율

F1

  • 재현율과 정밀도의 조화평균

데이터 균형 전 결과

균형전 결과
균형 후 결과

데이터를 균형맞췄을때 값이 왜 이렇게 변화하는지 서술

펄서 예측 데이터셋의 데이터들은 90.8%정도만 일반 별이고 9.2%만 펄서이다. 이 떄문에 무조건 펄서가 아니라고 답하는 방법만으로 90%이상의 정확도를 쉽게 달성할 수 있다. 그래서 데이터 균형이 필요하다. 데이터 셋에서 별과 펄서가 비슷한 수가 되도록 데이터 비율을 바꾸어 출현빈도가 낮은 펄서를 학습하는 기회를 늘려보는 것 이다. 균형잡힌 데이터로 신경망을 학습시키면 정확도 정밀도 재현율 F1값 중 재현율은 크게 좋아졌다. 재현율 상승에 힘입어 F1값도 높아졌다. 데이터가 균형을 잡으면서 정확도가 하락한것 같지만 실제로는 성능이 크게 좋아진 결과이다.

728x90

댓글