인공지능/자연어 처리

자연어 처리 모델 학습 - 파인 튜닝 방법 1

이게될까 2024. 3. 29. 18:41
728x90
728x90

목표 - 파인 튜닝 시 다양한 파인 튜닝 방법에 대해 이해하기 

파인 튜닝 요약

파인 튜닝으로 모델을 학습할 때 이전의 모델에 새로운 레이어를 붙여서 학습한다.

 

파인 튜닝의 세 가지 방법

3- 컴퓨팅 연산 능력 부족, 데이터셋 부족, 데이터가 매우 유사할 때 사용

모델 Freezing이란

일반화된 피쳐 - 사전학습된 모델이 초반에 잘 뽑아준다. -> 바꾸지 않는다. = freezing한다.

 

어떤 상황에 어떤 전략을 택해야 할까?

데이터 셋이 크다 = 일반적인 패턴을 잡아 낼 수 있다.

모든 레이어를 다 활용하기에는 오버피팅을 할 가능성이 매우 크기 때문에 초반에서 일반화를 잘 했다고 기대하고 고정시킨 뒤에 부분을 학습시킨다.

 

최신 모델 tuning 방법

모델 안에 레이어를 추가하겠다.

adapter가 추가되었다.

adapter layer

입력으로 들어가는 프리픽스(prefix) 토큰만 학습시키는 것이다. - 작업이 바뀌면 prefix만 바꾸면 된다.

모델에 영향을 주지않고 여러가지 일을 할 수 있는 것이다.

입력에 예시를 주거나 설명을 해주는 것이다.

728x90