728x90
728x90
질병의 발병률이 1%라고 생각하자!
모두 음성이라고 추측하면 99%의 정확도를 가지게 된다....
이것은 불균형 데이터이다.
시스템을 향상시키기 위해 고려해야할 3가지!
스팸 골라내는 프로그램을 통해 알아보자
이진 분류!
스팸 메일은 물건을 팔고자 하거나 홍보를 하는 메일이고, 우리가 모르는 곳에서 보낸 메일이다.
지도학습 머신러닝 알고리즘을 통해 만들 수 있다.
특징 차원은 100차원이 된다.
오 가짜 이메일 주소 만드는 건 좀 괜찮네
스페머들은 이걸 애매하게 만들기도 한다.
이런 데이터를 통해 정보를 얻을 수 있다.
컴퓨터가 매칭할 수 없도록 이상하게 작성한 단어를 찾아내는 알고리즘도 만들어야 한다.
GPT 겁나 경량화 해서 넣으면 엄청 잘할거 같은데,,,
728x90
'인공지능 > 공부' 카테고리의 다른 글
모두를 위한 머신러닝 10주차 3차시 - 불균형 데이터의 경우 오차 평가 척도 (0) | 2024.05.09 |
---|---|
모두를 위한 머신러닝 10주차 2차시 - 오차 분석 방법 (0) | 2024.05.09 |
이전부터 살짝 아리까리 했던 RNN 정리하기 (0) | 2024.05.09 |
인공지능과 빅데이터 10주차 3차시 - 인공지능 윤리의 중요성과 원칙 (0) | 2024.05.07 |
인공지능과 빅데이터 10주차 2차시 - 인공지능 윤리이슈 (1) | 2024.05.07 |