인공지능/자연어 처리

임베딩이란 ? - 임베딩 간 유사도 계산

이게될까 2024. 3. 7. 02:49
728x90
728x90

목표 - 임베딩 간 유사도를 측정하는 다양한 방법들을 알 수 있다.

 

텍스트 유사도란?

 

유사도 계산 방법

 

유클리디안 거리 기반 유사도

 

유클리디안 거리 기반 유사도 실습

의도한 것으로 동작하는 것을 볼 수 있다.

가까울수록 의미가 유사하다!

 

유클리디안 거리 기반 유사도의 특징

 

유클리디안 거리 기반 유사도 + L1 정규화

 

 

맨하탄 거리 기반 유사도

유클리디안이랑 큰 차이는 안날것 같다.

 

맨하탄 거리 기반 유사도 특징

 

코사인 유사도

 

코사인 유사도 실습

벡터간 유사도를 볼 때 코사인 유사도를 많이 본다.

 

자카드 유사도

 

자카드 유사도 실습

 

 

문자열 간 유사도
해밍 거리

자주 쓰이지 않는다.

 

강의 요약

 

728x90