728x90
728x90
목표 - 자연어를 컴퓨터가 이해할 수 있게 수치화하는 이유와 수치화의 방식인 임베딩을 이해하기
아스키 코드는 구분을 해줄 뿐 의미를 담고있지 않다.
이차원 벡터화를 안하고 저렇게 표현하나....?
일단 아스키 코드로 변환하는 것 보다 의미를 담을 수 있게 된다.
벡터화 간의 사직연산이 가능하다!
언어학적 지식들이 점점 불필요해졌다. - 다량의 데이터로 해결
728x90
'인공지능 > 자연어 처리' 카테고리의 다른 글
임베딩이란? - 임베딩 구축 방법 2 - 분포 가설과 언어 모델 (0) | 2024.03.07 |
---|---|
임베딩이란 ? - 임베딩 구축 방법 1 - 단어의 출현 빈도 (0) | 2024.03.07 |
컴퓨터는 자연어를 어떻게 이해하는가? - 자연어 특성 (1) | 2024.03.06 |
한국어 데이터 전처리 - 한국어 코퍼스 전처리 Python 실습 (1) | 2024.03.06 |
한국어 데이터 전처리 - 한국어 형태소 분석 (KoNLPy, Mecab활용) (0) | 2024.03.05 |