'2024/06/07 글 목록

강화학습 7강 - DEEP RL 개요

테이블 대신에 함수를 사용한다mse를 최소로 하는 선을 찾아서 없는 값들도 유추할 수 있다.일반적인 직선 말고도 다항 함수를 사용하여 데이터 점들을 가장 가깝게 지나가게 할 수 있다.고차함수에 가깝게 갈수록 mse는 떨어지겠지만 노이즈에 민감하게 반응한다 언더 피팅 : 함수의 유연성이 부족하여 주어진 데이터와 에러가 너무 크다.오버 피팅 : 함수가 너무 유연하여 노이즈에 피팅해버리는 것 실험을 통해 주어진 데이터는 노이즈가 껴있기 때문에 적절하게 차수를 선정해야 한다. 강화학습에서 state가 너무 많으면 테이블의 모든 Value를 담을 수 없다. -> Value를 구하는 함수를 학습하자.일반화 : 전체를 다 경험하지 못하더라도 일부 샘플만으로 전체를 추정하는 것함수를 인공 신경망을 통해 복잡하게 만들어..

인공지능/강화학습 2024.06.07

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

공대생 도전 일지

2024/06/07 2

티스토리툴바