728x90
728x90
CNN은 영상의 픽셀 단위로 필터를 적용하고 있다.
픽셀보다는 큰 단위가 패치이다.
패치 번호가 중요하다.
positional embedding 이 패치의 번호가 어디고, 상관 관계의 번호를 기억한다.
이걸 더 발전 시켜서 Swin, PVT 등등 나오고 있다.
728x90
'인공지능 > 공부' 카테고리의 다른 글
생성형 인공지능 5주차 3차시 Transformer - U-net 형 model (0) | 2024.04.02 |
---|---|
생성형 인공지능 5주차 2차시 transformer - ViT 모델 (0) | 2024.04.02 |
모두를 위한 머신러닝 5주차 퀴즈 (0) | 2024.04.02 |
머신러닝 5주차 5차시 - 다항 회귀의 정규화 (0) | 2024.04.01 |
머신러닝 5주차 4차시 - 로지스틱 회귀의 정규화 (0) | 2024.04.01 |