728x90
728x90
다항식의 차수는 얼마나 할까?
특징값은 얼마나 포함할까?
정규화 파라미터는 어떻게 선택할까?
학습, 검증, 테스트 데이터로 나누기!
예측 함수가 새로운 데이터에서도 잘 작동한다고 보장할 수 없다.
학습 오차가 검증이나 테스트 오차보다 작다.
1 ~ 10차 함수까지 다 고려하여 적합한 다항식 차수 찾기이다.
test 오차를 검사한다! 검증 데이터는 안쓰네
공정한 평가가 아니다!
여기서 validation이 나오네요
세 가지의 오차값을 구할 수 있게 된다.
일단 train을 통해 최적 파라미터를 각각 구한다.
validation을 통해 최소 오차인 차수를 구한다! -> 그걸로 test data를 오차 계산
728x90
'인공지능 > 공부' 카테고리의 다른 글
모두를 위한 머신러닝 9주차 4차시 - 학습 곡선 (0) | 2024.05.02 |
---|---|
머신러닝 9주차 3차시 - bias, Variance (0) | 2024.05.02 |
머신러닝 9주차 1차시 - 예측 함수 성능 평가(데이터 셋 분류) (1) | 2024.05.01 |
인공지능과 빅데이터 9주차 3차시 - 빅데이터와 데이터 마이닝 (0) | 2024.04.29 |
인공지능과 빅데이터 9주차 2차시 - 데이터 수집, 관리, 분석 (0) | 2024.04.29 |