인공지능/자연어 처리

자연어 처리 python - 워드 임베딩 만들기 - Fast Text

이게될까 2024. 3. 16. 13:39
728x90
728x90

목표 - 대표적인 단어 임베딩 방법론인 FastText의 작동 원리를 이해할 수 있다.

FestText란
FastText의 특징
FastText 동작 원리

여기서 n-gram은 단어단위 이다.

 

모델 학습 방법

학습을 이전의 방식(skip gram)보다 훨씬 많이 할 수 있다.

FestText With Negative Sampling

C = 주변 단어 

유사도 = 코사인유사도 -> 단어에 대한 여러 벡터와 주변 단어 모든 벡터를 내적

여기선 분자를 최대화 해야 한다. -> 내적을 최소화 한다.

 

FastText장점

 

한국어에서의 FestText

728x90