인공지능/공부

생성형 인공지능 4주차 Transformer 5차시 - Transformer 동작 원리

이게될까 2024. 3. 27. 15:16
728x90
728x90

 

positional Encoding - 임베딩된 단어 정보에 위치 정보 추가

 

디코더

 

GPT 는 더 개선된 Transformer 구조를 보인다.

 

Soft-max == 정규화

 

 

728x90