반응형

인공지능/공부 281

모두를 위한 머신러닝 11주차 2차시 - 최대 마진 개념

SVM이 왜 최대 마진 분류기라고 불리는지 ?좀 더 안전한 마진이 생기도록 변환한 것이다!빨간색 영역에 대해서는 고려하지 않는다.cost 함수의 값을 0으로 하여 전체 비용 함수를 다시 표현하면 간단하게 표현할 수 있다.그럼 정규화 항을 통해서만 학습하나....? 마진이 뭘까? - 오차?두 데이터 간의 거리이다.w 값을 극대화 해야 한다. 이진 분류 문제에서 생각해보자 이론적으로 많은 경계를 구할 수 있지만 최대 마진은 하나만 존재한다!마진 위의 데이터를 서포터 백터라고 한다. 이상치가 존재하는 경우 어떻게 될까?여기서 매우 특이한 데이터가 추가된다.C가 매우큰 경우 잘못된 데이터에 매우 민감하다.C가 매우 큰 경우 잘못된 데이터에 민감하다.C가 작은 경우 이상치에 민감하지 않다.C 값이 너무 크지 않으..

인공지능/공부 2024.05.17

모두를 위한 머신러닝 11주차 1차시 - SVM의 최적화 목적 함수

오른쪽이 더 큰 마진을 가지고 있으므로 더 잘 분류한다고 볼 수 있다. 이 것을 단순한 직선형태로 표현해보자!직선의 기울기는 중요하지 않다이 것도 근사화 해보자정규화 항도 포함시켰다.직선함수로 근사화 시켜서 계산량이 훨씬 적다.m은 데이터 샘플 개수이다.최소화하는 과정에 있어서 양수를 곱하는 것은 결과에 영향을 주지 않는다.C는 정규화 항에서 나온다.  단지 m과 람다를 통해 단순화 시켰다.

인공지능/공부 2024.05.17

인공지능과 빅데이터 15주차 - 딥러닝, 정형데이터 다중 분류

1차시 - 정형 데이터 다중 분류 1출력값의 합이 항상 1로 고정된다.또 데이터 저장하기!class를 컴퓨터가 이해할 수 있도록 변경해줘야 한다.섞였다.데이터 시각화!주황색은 구분되어 있지만 파란색과 초록색은 섞여있다.옹... 이걸 이렇게 변환하네요...? 2차시 - 비정형 데이터 다중 분류 실습 1라이브러리 입력데이터나누기데이터전처리라벨 원핫 인코딩을 진행했다.학습하고 시각화까지 진행한다. 3차시 - 비정형데이터 다중 분류 실습 2

인공지능/공부 2024.05.14

인공지능과 빅데이터 14주차 - 다층 퍼셉트론, 이진 분류

1차시 - 다층 퍼셉트론 설계 인간은 1000억개의 뉴런이 존재한다. -> 신호를 전달하는 간단한 역할을 한다.입력한 값이 계산을 통해 출력으로 나온다. 선형회귀와 퍼셉트론의 차이는 활성화 함수이다!활성화 함수 때문에 비선형을 표현할 수 있게 되었다.또 and or XOR....히든레이어에서 왜곡이 일어난다   2차시 - 정형데이터 이진 분류 실습 1 데이터를 불러와서 읽어본다.데이터 정보 확인!속성간의 연관성을 확인할 수 있다.2024.04.22 - [인공지능/공부] - 딥러닝개론 정리 1 - 머신러닝, 딥러닝, backpropagation, 잡음 주입, 정규화, 규제화 딥러닝개론 정리 1 - 머신러닝, 딥러닝, backpropagation, 잡음 주입, 정규화, 규제화인공지능 - 인간의 지능을 모방하..

인공지능/공부 2024.05.14

인공지능과 빅데이터 13주차 - 데이터 전처리 이론, 실습

1차시 - 데이터 전처리 개요허점이 있다!데이터가 올바르지 않으면 출력도 좋지 않다.데이터의 중요성이 크다!시각화도!데이터가 무엇보다도 중요하다!필요한 데이터가 많아야 한다.raw 데이터를 가공을 통해 좋은 데이터로 만든다.쓸모없는 데이터가 가장 중요한 데이터가 뭔지 판별할 수 있어야 한다.Pandas를 사용하면 데이터 프레임구조를 가진다.결측치는 0으로 채우거나, 그 행을 지우는 등의 방식으로 사용할 수 있다.정답과의 상관관계가 가장 높은 것을 봐야 한다.이 것은 결과를 통해 설명한다. 2차시 - 정형 데이터 전처리 실습정형 데이터 - 엑셀과 같이 정리된 데이터들데이터셋 위치다운로드 받는 법8개의 속성과 한개의 클래스이러한 코드 진행을 통해 파일을 업로드하고, 읽을 수 있다.일부 데이터만 확인하여 흐름..

인공지능/공부 2024.05.13

인공지능과 빅데이터 12주차 - 선형회귀 모델링, 학습, python 실습

1차시 - 선형회귀 모델링목적함수를 잘 설정하는 것이 중요하다!데이터가 많아지면 문제가 생기도 한다.MSE를 최소화 한다! 2차시 - 선형 회귀에서의 경사하강법 기울기를 최소로하는 a*값을 찾아야 한다!2차함수 최저점의 기울기는 0이다!그 지점을 찾기 위해 경사 하강법이 나온다a 값을 바꿔가면서 낮은 곳으로 차차 진행하는 것이다.오버슈팅!미니 배치 사이즈가 1이면 SGD이다.가장 잘 표현한다. == 오차(MSE)가 가장 적다. 3차시 - 선형회귀 실습자기 편한 환경에서 진행하면 된다.라이브러리 불러오기구조를 확인할 수 있다.

인공지능/공부 2024.05.13

인공지능과 빅데이터 11주차 - 딥러닝 작업 환경 만들기, 기본 코드 실행하기

1차시 - 딥러닝 작업 환경 만들기이미 검증되어 활용된 알고리즘이 있다딥러닝 프레임워크는 이미 검증된 알고리즘들을 손쉽게 다룰 수 있도록 해준다.shift + enter = 실행텐서 플로우 불러오기!GPU 사용하는지 확인하기이런 설정을 통해 GPU 사용이 가능하다.2차시 - 딥러닝 작업 환경 만들기 2 프로젝트별 환경을 설정하여 효율적인 환경을 구축할 수 있다.콘솔을 통해 진행할 수 있다.이건 콘솔에서 실행된다.계속 진행할 수 있다.3차시 - 테스트 코드 실행옹 그냥 다운받기 하면....데이터 파일을 업로드해서 올릴 수 있다.파이참에선 위와 같이 실행할 수 있다. 콘솔 환경에서도 진행 가능하다.라이브러리 버전을 볼 수 있다.저렇게 안하면이렇게 길게 작성해야 한다.

인공지능/공부 2024.05.13

생성형 인공지능 입문 10주차 퀴즈

1. 다음 문장의 빈칸에 들어갈 가장 적절한 단어를 고르시오.“특징 추출의 목표는 __을 줄이고, __를 제거하며, 데이터의 가장 변별력 있는 측면을 강조하여 후속 분석 또는 머신 러닝 작업을 용이하게 하는 것”하나를 선택하세요.차원, 노이즈컴퓨터용량, 오류뉴럴 스타일 전송패턴인식나머지들이 너무 아니라.... 1번다음 문장의 빈칸에 들어갈 가장 적절한 단어는 "차원, 노이즈"입니다.문장을 완성하면:"특징 추출의 목표는 차원을 줄이고, 노이즈를 제거하며, 데이터의 가장 변별력 있는 측면을 강조하여 후속 분석 또는 머신 러닝 작업을 용이하게 하는 것"특징 추출은 데이터의 복잡성과 불필요한 정보를 줄여서 효과적인 머신러닝을 가능하게 만드는 과정입니다.2. 다음 중 틀린것을 고르시오.트렌스포머 네트워크 응용이 ..

인공지능/공부 2024.05.12
728x90
728x90