728x90
728x90
목표 - 다양한 한국어 형태소 분석기를 포함하는 KoNLPy를 활용하여 한국어 형태소 분석 과정을 이해할 수 있다.
일본어도 한국어와 같이 교착어의 특성을 가진다!
어떤 특성이 가장 잘 맞을지 고르면 된다.
작업에 맞는 품사 분류를 고르면 된다.
정제과정 속에서의 부작용, 규칙 기반을 통한 분리에서 오류가 나기 때문이다.
728x90
'인공지능 > 자연어 처리' 카테고리의 다른 글
컴퓨터는 자연어를 어떻게 이해하는가? - 자연어 특성 (1) | 2024.03.06 |
---|---|
한국어 데이터 전처리 - 한국어 코퍼스 전처리 Python 실습 (1) | 2024.03.06 |
한국어 데이터 전처리 - 서브워드 토큰화 (BPE 활용) (0) | 2024.03.02 |
한국어 데이터 전처리 - 토큰화 Tokenization (0) | 2024.03.02 |
한국어 데이터 전처리 - 정제(Cleaning) 및 정규화(Normalization) (0) | 2024.03.02 |