728x90
728x90
interactive GPT model = Chat GPT
vision에서는 컴퓨팅 파워가 더 강력해야 한다.
실시간 상호작용과 사용자 중심!
보통 supervised learning에서는 보상이 없다.
강화학습을 사용하는 것이다. 파인튜닝에는 강화학습과 지도학습이 둘 다 들어있다!
PPO - 강화학습 쪽 기본 개념
현재 실시간 정보는 아직 해결하지 못한 문제이다.
심심이와 같은 모델이다.
728x90
'인공지능 > 공부' 카테고리의 다른 글
생성형 인공지능 입문 6주차 퀴즈 (1) | 2024.04.10 |
---|---|
생성형 인공지능 입문 6주차 5차시 - 휴먼 피드백 학습 (0) | 2024.04.10 |
생성형 인공지능 입문 6주차 3차시 - Fine tuning(미세조정) (0) | 2024.04.10 |
생성형 인공지능 6주차 2차시 - GPT model (0) | 2024.04.10 |
모두를 위한 머신러닝 6주차 퀴즈 (0) | 2024.04.10 |