이번 시간은 13주차 입니다. 13주차 강의는 총 5개의 차시로 구성되어 있습니다. 이번 강의에서는 강화학습 리뷰, 판단 트랜스포머, 행동 생성용 트랜스포머, 셰프 로봇의 행동 생성, AI 기반 행동 생성을 다룹니다. 강의를 통해서 여러분은 강화학습, 트랜스포머 기반 강화학습, 행동 생성용 트랜스포머를 설명할 수 있고, 생성형 AI기반 요리로봇, AI기반 행동 생성 기법을 설명할 수 있게 됩니다. 아래 영상의 재생 버튼을 클릭하여 학습을 시작하세요.1차시 - 강화 학습 리뷰강화 학습을 마지막 단에 넣는다.비지도 학습을 통해 추론과 생성을 진행할 수 있다.정책을 따라 리워드를 받고 학습하는 강화학습!SART를 하나의 튜플로 만들어서 확인한다.보상의 중요도가 엄청 높았다. 궁극적으로 많은 리워드를 받는 것이..