반응형

2024/05/17 2

모두를 위한 머신러닝 11주차 2차시 - 최대 마진 개념

SVM이 왜 최대 마진 분류기라고 불리는지 ?좀 더 안전한 마진이 생기도록 변환한 것이다!빨간색 영역에 대해서는 고려하지 않는다.cost 함수의 값을 0으로 하여 전체 비용 함수를 다시 표현하면 간단하게 표현할 수 있다.그럼 정규화 항을 통해서만 학습하나....? 마진이 뭘까? - 오차?두 데이터 간의 거리이다.w 값을 극대화 해야 한다. 이진 분류 문제에서 생각해보자 이론적으로 많은 경계를 구할 수 있지만 최대 마진은 하나만 존재한다!마진 위의 데이터를 서포터 백터라고 한다. 이상치가 존재하는 경우 어떻게 될까?여기서 매우 특이한 데이터가 추가된다.C가 매우큰 경우 잘못된 데이터에 매우 민감하다.C가 매우 큰 경우 잘못된 데이터에 민감하다.C가 작은 경우 이상치에 민감하지 않다.C 값이 너무 크지 않으..

인공지능/공부 2024.05.17

모두를 위한 머신러닝 11주차 1차시 - SVM의 최적화 목적 함수

오른쪽이 더 큰 마진을 가지고 있으므로 더 잘 분류한다고 볼 수 있다. 이 것을 단순한 직선형태로 표현해보자!직선의 기울기는 중요하지 않다이 것도 근사화 해보자정규화 항도 포함시켰다.직선함수로 근사화 시켜서 계산량이 훨씬 적다.m은 데이터 샘플 개수이다.최소화하는 과정에 있어서 양수를 곱하는 것은 결과에 영향을 주지 않는다.C는 정규화 항에서 나온다.  단지 m과 람다를 통해 단순화 시켰다.

인공지능/공부 2024.05.17
728x90
728x90