인공지능/자연어 처리

자연어 처리 정리 - 7강 Text classification with CNN

이게될까 2024. 4. 13. 18:02
728x90
728x90

 

타 딥러닝, 머신러닝에서 사용했던 classification과 차이는 없다.

classification - 2개 중 한 개, 여러 개 중 한 개, 여러 개 중 여러 개

혼동 행렬 - 평가 척도

 

정확도 - 단순하게 전체 중 정답을 맞춘 정도

 

정밀도 - 참이라고 예측, 판단한 것 중 참인 것 

ex) 프로그램이 암이라고 예측한 사람들 중 진짜 암인경우

 

재현율 - 참인데 참이라고 맞춘 것 

ex) 암에 걸린 사람들 중 예측 프로그램이 얼마나 맞췄냐

 

precision 정밀도 - 정확성이 중요한 경우 - 참이라고 예측한 경우 중 참인 확률

recall 재현율 - 최대한 많은 옵션을 주는 경우 - 참을 참이라고 예측한 확률

 

그냥 평균하몬 된다.

B의 영향이 너무 커지긴 한데...

Multi label classification

한 개의 카테고리만 가지지 않는다.

 

 

 

 

 

 

 

 

 

 

Embedding -> Convolution -> pooling -> FNN of Soft max

토큰 -> id_index -> Word2Vec

 

 

 

 

728x90