인공지능/공부
머신러닝 3주차 3차시 - 경사 하강, 학습 속도
이게될까
2024. 3. 18. 23:59
728x90
728x90
오버 슈팅, 너무 느린 수렴 속도
이것 때문이라도 스케일링이 중요하겠네요
초기에는 빠르게 감소하다가 수렴에 다가가면 천천히 감소한다 -> 언제 비용함수 값이 최솟값에 도달했는지 판단할 수 있다.
경사 하강의 발산 - 오버슈팅 -> 학습 상수가 너무 크다.
보통 저는 0.001 사용했던것 같네요
adam optimizer로 보완된건가...?
factor는 사용해본적이 없네요.
그냥 0.03을 넣은 적은 있어도,..
728x90