728x90
728x90

SGD - 샘플마다 업데이트하기 때문에 진동이 크다!

모든 샘플을 다 사용하는 batch learning!(epoch learning)
local min에 빠질 위험이 크다!


두가지를 섞어서!



parameter update = 최적화





오버피팅, 과적합


주황색이 test data겠네요


오버피팅 된 weight의 값은 크다 -> weight의 값을 감소시킨다.









오버피팅 방지, 학습 다향성 증가
728x90
'인공지능 > 자연어 처리' 카테고리의 다른 글
자연어 처리 정리 - 8강 Machine Translation with RNN (0) | 2024.04.13 |
---|---|
자연어 처리 정리 - 7강 Text classification with CNN (0) | 2024.04.13 |
자연어 처리 5강 - Deep Learning Recap 1 (0) | 2024.04.12 |
자연어 처리 정리 - 4강 word embedding 2 (0) | 2024.04.12 |
자연어 처리 정리 - 3강 Word embedding 1 (1) | 2024.04.12 |