인공지능/공부
생성형 인공지능 4주차 Transformer 4차시 - Multi-Head Attention 다중머리 주의
이게될까
2024. 3. 26. 20:09
728x90
728x90
긴 문장, 큰 이미지 등 input이 엄청 클 때 사용된다. (h1, h2, h3 ...... hn)
대부분이 Multi-head를 사용한다.
728x90