인공지능/공부

머신러닝 9주차 2차시 - 최적 모델의 선택(데이터 셋 나누기)

이게될까 2024. 5. 1. 23:55
728x90
728x90

다항식의 차수는 얼마나 할까? 
특징값은 얼마나 포함할까?
정규화 파라미터는 어떻게 선택할까?

학습, 검증, 테스트 데이터로 나누기!

예측 함수가 새로운 데이터에서도 잘 작동한다고 보장할 수 없다.

학습 오차가 검증이나 테스트 오차보다 작다.

1 ~ 10차 함수까지 다 고려하여 적합한 다항식 차수 찾기이다.

test 오차를 검사한다! 검증 데이터는 안쓰네

공정한 평가가 아니다! 
여기서 validation이 나오네요

 

세 가지의 오차값을 구할 수 있게 된다.

일단 train을 통해 최적 파라미터를 각각 구한다.

validation을 통해 최소 오차인 차수를 구한다! -> 그걸로 test data를 오차 계산

728x90