생성형 인공지능 입문 6주차 5차시

인공지능/공부

생성형 인공지능 입문 6주차 5차시 - 휴먼 피드백 학습

이게될까 2024. 4. 10. 20:20

728x90

학습을 어떤 형식으로 하느냐!

GPT의 등장으로 휴먼 피드백 러닝의 적용이 시작되었다.

사람이 model의 출력이 정확한지 판단하는 것!

리워드를 올리기 위해 행동하는 강화학습!

사람의 피드백이 편향을 가지지 않도록 학습해야된다.

LLM- 완성이라는 것이 없다. -> 계속 학습하면서 발전해나간다. - 돈이 한도 없이 들어간다

이 것은 논문으로 작성할 수 있는 것이 아니라 시도, 경험을 통해 노하우를 얻는 것이다.

attention, Transformer 정리 1 (0)	2024.04.11
생성형 인공지능 입문 6주차 퀴즈 (1)	2024.04.10
생성형 인공지능 입문 6주차 4차시 - interactive GPT model (대화형 GPT 모델) (0)	2024.04.10
생성형 인공지능 입문 6주차 3차시 - Fine tuning(미세조정) (0)	2024.04.10
생성형 인공지능 6주차 2차시 - GPT model (0)	2024.04.10

NLP, AI, XAI에 관심있는 공대생의 일기장...?