인공지능/공부

머신러닝 4주차 1차시 - 이진분류 Binary classification

이게될까 2024. 3. 25. 18:53
728x90
728x90

코로나 양성, 음성 -> 이진분류 = 데이터의 분류 결과가 2가지의 가능한 값으로만 나타나는 경우

ex) 불량품 검출, 스팸 메일 필터링

이진 분류 예시

y = 0,1로 나타넨다.

 

다중 분류

Multi classification

 

선형회귀를 분류문제에 사용할 수 없을까?

여기까지만 보면 성공적으로 분류한 것 같다.

이상치가 있으면 데이터가 많이 이상하게 된다.

Sensitive to outliers = 선형 회귀는 이상치에 민감하다.

그리고 결과도 0~1로 항상 고정되지 않는다.

 Sigmoid를 활용하면 0~1에 한정되게 된다.

Sigmoid == Logistic function

Sigmoid를 활용하므로 이 두 개는 같은 것이다.

 

y=1이 되는 확률을 구하는 것이다!

0이 될 확률과 1이될 확률은 반비례이고 더하면 1이다.

 

 

728x90