728x90
728x90
목표 - 분포 가설에 기반한 임베딩 구축 방법과 언어 모델 기반의 임베딩 구축 방법에 대해 이해하기
2번이랑 3번이랑 중요도가 살짝 애매하네유
주변 단어를 통해 뜻을 유추할 수 있다.
독립적이면 서로 관련 없는 단어로 볼 수 있고, 확률이 높다면 의미가 연결되어 있다고 볼 수 있다.
CBOW - 중심 단어를 주변 단어를 통해 유추한다
SKIP gram - 중심 단어를 통해 주변 단어를 유추한다.
엄청나게 작은 확률로 등장할 것 입니다..
문장이 길수록 확률이 점점 낮아지기 때문에 n-gram을 통해 제한하게 되면 확률이 많이 높아지게 된다.
근본적으론 빈도 기반이다.
728x90
'인공지능 > 자연어 처리' 카테고리의 다른 글
자연어 처리 python 실습 - BERT 모델의 임베딩 간 유사도 측정 (0) | 2024.03.13 |
---|---|
임베딩이란 ? - 임베딩 간 유사도 계산 (0) | 2024.03.07 |
임베딩이란 ? - 임베딩 구축 방법 1 - 단어의 출현 빈도 (0) | 2024.03.07 |
자연어 처리 python - 컴퓨터는 자연어를 어떻게 이해하는가? (0) | 2024.03.06 |
컴퓨터는 자연어를 어떻게 이해하는가? - 자연어 특성 (1) | 2024.03.06 |