인공지능/공부

생성형 인공지능 입문 6주차 5차시 - 휴먼 피드백 학습

이게될까 2024. 4. 10. 20:20
728x90
728x90

학습을 어떤 형식으로 하느냐!

 

GPT의 등장으로 휴먼 피드백 러닝의 적용이 시작되었다.

사람이 model의 출력이 정확한지 판단하는 것!

리워드를 올리기 위해 행동하는 강화학습!

사람의 피드백이 편향을 가지지 않도록 학습해야된다.

LLM- 완성이라는 것이 없다. -> 계속 학습하면서 발전해나간다. - 돈이 한도 없이 들어간다

이 것은 논문으로 작성할 수 있는 것이 아니라 시도, 경험을 통해 노하우를 얻는 것이다.

 

728x90