728x90
728x90
학습을 어떤 형식으로 하느냐!
GPT의 등장으로 휴먼 피드백 러닝의 적용이 시작되었다.
사람이 model의 출력이 정확한지 판단하는 것!
리워드를 올리기 위해 행동하는 강화학습!
사람의 피드백이 편향을 가지지 않도록 학습해야된다.
LLM- 완성이라는 것이 없다. -> 계속 학습하면서 발전해나간다. - 돈이 한도 없이 들어간다
이 것은 논문으로 작성할 수 있는 것이 아니라 시도, 경험을 통해 노하우를 얻는 것이다.
728x90
'인공지능 > 공부' 카테고리의 다른 글
attention, Transformer 정리 1 (0) | 2024.04.11 |
---|---|
생성형 인공지능 입문 6주차 퀴즈 (1) | 2024.04.10 |
생성형 인공지능 입문 6주차 4차시 - interactive GPT model (대화형 GPT 모델) (0) | 2024.04.10 |
생성형 인공지능 입문 6주차 3차시 - Fine tuning(미세조정) (0) | 2024.04.10 |
생성형 인공지능 6주차 2차시 - GPT model (0) | 2024.04.10 |