게임을 잘 하려면 여러가지 시도를 통해 학습을 해야한다.에이전트는 환경과 상호작용하며 게임의 참가자이다.환경은 관측치를 에이전트에게 넘겨준다.에이전트는 액션을 통해 환경을 변화할 수 있다.여기서 환경은 시뮬링크 모델을 통해 시뮬레이션 된다.모든 값들은 Matlab에서 변수로 표현된다.에이전트, 환경, 관측값, 행동은 모두 MATLAB에서 변수로 표현됩니다.관측값과 행동을 정의할 방법을 지정하려면 rlNumericSpec 함수 또는 rlFiniteSetSpec 함수를 사용합니다. 관측 가능 상태 또는 가능한 행동으로 구성된 유한 집합이 있는 경우에는 rlFiniteSetSpec을 사용합니다. 관측값 또는 행동이 유한 집합을 형성하지 않는 숫자형 값으로 지정된 경우에는 rlNumericSpec을 사용합니다...