인공지능/자연어 처리

자연어 이해 NLU- 감정 분석 Sentiment Analysis Task

이게될까 2024. 4. 1. 00:28
728x90
728x90

목표 - 대표적 NLU task인 감정 분석 작업에 대해 이해할 수 있습니다.

감정 분석 작업이란

감정을 감정 그대로 보기 보단 긍정, 부정, 의견 분석 정도로 볼 수 있다.

 

감정 분석 수행 방법

감성이야 감정이야....?

 

감성 분석의 발전 방향

 

텍스트 마이닝과 감성 분석

 

어휘 기반 감성 분석

사전이 잘못되면 틀리겠네요.... 아니면 처음 보는 단어에도 많이 약하고여

 극성이나 강도에 따른 주석이 달린 사전을 만든다. -> 사람이 모든 것을 수집 후 구축해야 한다. -> 비용 많이 발생 및 시간의 흐름을 따라잡기 힘들다. and 사전에 없는 것 대응 못한다.

 

머신러닝 기반 감성 분석

SVM - 구축한 통계를 벡터화

다른 지식에 적용할 수 없다..ㅠ -> 일반화 성능이 좋지 않다.

 

딥러닝 기반 감성 분석

예외 사항이 발생했을 때도 강건하게 대처 가능하다.

이건 계속 안좋다고 했던 구조잖어

그러나 이런 구조에서 크게 나쁠것 같지는 않네요

 

 CNN - 각 부분의 특징을 추출한다. 

추출된 특징을 반복하여, RNN의 hidden state처럼 전체 문장을 요약하는 하나의 압축된 representation을 얻고, 해당 representation을 output layer에 통과시켜서 최종 class label을 얻어낸다.

아직 모델구조가 효율적이지 않고, 대량의 정보를 학습하는데 좋지 않다.

 

언어 모델 기반의 감성 분석

문장 두개가 들어갔을 때 두 문장의 유사도를 판별하는 네트워크 이다.

중간 레이어를 활용하여 추론을 진행한다는 것이다. (진행할수록 이전 정보가 사라질 확률이 크기 때문)

레이어들이 가진 정보들이 클레스마다 분류를 명확하게 해준다.

 

감성 분석 벤치마크 데이터 셋

5개로 나누면 더 분류하기 어려워져 완벽하게 정복되지 않았다.

이 것도 이진분류이기 때문에 이전에 이미 정복되었다.

 

728x90