인공지능/공부

모두를 위한 머신러닝 10주차 1차시 - 머신러닝 시스템 설계 시 고려사항

이게될까 2024. 5. 9. 15:23
728x90
728x90

질병의 발병률이 1%라고 생각하자!

모두 음성이라고 추측하면 99%의 정확도를 가지게 된다....

이것은 불균형 데이터이다.

 

시스템을 향상시키기 위해 고려해야할 3가지!

스팸 골라내는 프로그램을 통해 알아보자

이진 분류!

스팸 메일은 물건을 팔고자 하거나 홍보를 하는 메일이고, 우리가 모르는 곳에서 보낸 메일이다.

지도학습 머신러닝 알고리즘을 통해 만들 수 있다.

특징 차원은 100차원이 된다.

오 가짜 이메일 주소 만드는 건 좀 괜찮네

스페머들은 이걸 애매하게 만들기도 한다.

`

이런 데이터를 통해 정보를 얻을 수 있다.

컴퓨터가 매칭할 수 없도록 이상하게 작성한 단어를 찾아내는 알고리즘도 만들어야 한다.

GPT 겁나 경량화 해서 넣으면 엄청 잘할거 같은데,,,

 

728x90