반응형

인공지능 665

생성형 인공지능 11주차 3차시 - Diffusion Model

디퓨전 모델은 확산 모델이라고 하지 않았나? 왜 분산 모델이지unet도 생성 및 노이즈 제거에 사용 가능 전방향(채택)도 있지만 후방향(거부)도 있다.노이즈를 추가했을 때 괜찮아진다면 전방향(채택), 별로가 되면 후방향(거부)으로 가는 것이다.괜찮아 지느 것을 으찌 판단하누 여기서 마르코프 프로세스가 나오네요    D ram이 너무 부족하다.

인공지능/공부 2024.05.18

생성형 인공지능 11주차 2차시 - 다양한 방법의 생성 모델

분포를 가져와서 비슷하게 만든다가장 오래된 이미지 생성 모델이다. 생성기와 판별기!생성 이미지가 점점 뚜렷해진다.  PGGAN과 비슷해 보인다.여기는 한꺼번히 해버린다. - 리소스가 엄청나다.  pre trained 모델을 활용한다.생성 모델도 파인튜닝을 통해 만들 수 있다. 다이내믹 스케일링 - 사이즈를 왔다 갔다 할 수 있도록발전 과정을 시각화할 수 있다.

인공지능/공부 2024.05.18

생성형 인공지능 11주차 1차시 - 언어 기반 영상 생성 구조

말, 언어를 이용해서 영상을 생성한다.죄다 짬뽕 되어 있네요가장 대표적인 아키텍쳐가 달리(DALL-E)이다.가장 선도적인 모델이다.트렌스포머 전에는 Colvolution이었다.transformer 모델이 성능이 좋아서 convolution에서 변경되었다.이미지가 상업적으로 쓸만해지면서 생성형 인공지능 파트가 중요해짐  BERT는 인코더 기반으로 긴 Sentence를 사용할 수 있다.다양한 이미지를 사용하고 싶으면 Vit를 진행하면 된다. txt와 사진을 전부 받을 수 있다. 디퓨전은 메모리가 사용이 많이된다. 생성 영상과 실제 영상을 비교해서 손실 함수를 계산한다.이 것도 실제 영상이 어쩔 수 없이 필요하긴 하네요 ㅎㅎ...

인공지능/공부 2024.05.18

모두를 위한 머신러닝 11주차 퀴즈

SVM에 관한 다음 설명 중에서 올바른 것을 모두 고르시오.하나 이상을 선택하세요.두 벡터 사이의 각도가 90°−270° 범위에 있으면 내적은 음수가 된다두 벡터 사이의 각도가 90°−270° 범위에 있으면 내적은 양수가 된다SVM에서 가중치 벡터에 대한 데이터의 투영이 클수록 비용 함수 값은 더 커진다SVM에서 가중치 벡터에 대한 데이터 투영이 클수록 비용 함수 값은 더 작아진다내적에서 반대 방향 (90 ~ 270도)는 음수가 된다!, 아까 가중치 벡터는 투영된 데이터와 반비례 하므로 투영된 데이터가 커지면 가중치 벡터는 작아지고, 비용함수는 작아진다!SVM에 관한 다음 설명 중에서 올바른 것을 모두 고르시오.하나 이상을 선택하세요.두 벡터 사이의 각도가 90°−270° 범위에 있으면 내적은 음수가 된..

인공지능/공부 2024.05.18

모두를 위한 머신러닝 11주차 5차시 - SVM 적용하기

미리 정의할 것 ! - C,  커널의 종류  커널이 없다 == 리니어 커널 == 입력과 출력이 동일하다. f == x 1과 크거나 같다 == 1, 아니다 == 0  커널을 사용할 때는 특징값 스케일링이 필수적이다!큰 값에 지배되기 쉽다. 유사한 값으로 만들어서 영향을 비슷하게 만들자 커널이 될 수 있는 조건을 만족하는 함수를 사용해야 된다. - Mercer's theprem   라이브러리는 다양하다!   다중 분류 문제에서도 사용 가능하다!다대 1? or 다른 패키지 사용하기 SVM을 k개 구현하기! 특징이 많은 경우 로지스틱 회귀를 적용한다.  n이 작고, m이 큰 경우 !!- 데이터가 큰 경우 -> 특징값의 개수를 늘린다.logistic 회귀와 커널 없는 svm은 비슷하다.DNN은 학습하는데, 연산하..

인공지능/공부 2024.05.18

모두를 위한 머신러닝 11주차 4차시 - 커널의 개념

복잡한 분류 문제는 비선형적인 분류 경계선이 필요하다.다항식 형태로 복잡한 비선형 문제의 분류선을 만들 수 있었다.다항식을 일반화시켜서 생각해보자다항식 항 외에도 더 좋은 선택이 있을까?다항식은 계산량이 많다는 문제가 있다.3개의 점을 랜드마크로 표시했다.커널 - 유사도!가우시안 커널 거리에 따른 커널 구하기!멀어지면 0, 가까워지면 1 시가마가 작아지면 - 폭이 좁아진다. 시그마에 따라 폭이 달라지게 된다.l1에 가깝기 때문에 1이 된다.모두와 멀게 되면 0으로 예측하게 된다.ㅣ1,ㅣ2 랜드마크와 가까우면 1, 멀면 0이 된다!이렇게 하여 복잡한 분류 선을 만들 수 있다. x대신에 f를 사용한다!시그마가 크다 -> 폭이 커진다 -> 언더 피팅

인공지능/공부 2024.05.18

모두를 위한 머신러닝 11주차 3차시 - 최대 마진 분류의 수학적 개념

기하학적으로 2차원 벡터 평면로 표현할 수 있다.그럼 이 둘의 내적은 어떻게 될까?백터의 크기는 스칼라 값이다.p의 길이는 v의 그림자 길이와 같다.부호가 있어서 +도 -도 가질 수 있다.1보다 크다는 것의 의미가 뭘까?이렇게 되면 원점을 지날 수 밖에 없다.n = 2라는 것은 2차원 공간이라는 것이다.decision 바운더리와 weight는 항상 직교한다.p와 w는 반비례한다.w가 커진다면 비용함수가 증가한다!-> p가 커야한다.이렇게 p가 크다면 w가 작아서 비용함수가 작아진다.최대 마진 분류 선을 만들어서 일반화 성능이 높다 ! -> 이상적이다.

인공지능/공부 2024.05.18

모두를 위한 머신러닝 11주차 2차시 - 최대 마진 개념

SVM이 왜 최대 마진 분류기라고 불리는지 ?좀 더 안전한 마진이 생기도록 변환한 것이다!빨간색 영역에 대해서는 고려하지 않는다.cost 함수의 값을 0으로 하여 전체 비용 함수를 다시 표현하면 간단하게 표현할 수 있다.그럼 정규화 항을 통해서만 학습하나....? 마진이 뭘까? - 오차?두 데이터 간의 거리이다.w 값을 극대화 해야 한다. 이진 분류 문제에서 생각해보자 이론적으로 많은 경계를 구할 수 있지만 최대 마진은 하나만 존재한다!마진 위의 데이터를 서포터 백터라고 한다. 이상치가 존재하는 경우 어떻게 될까?여기서 매우 특이한 데이터가 추가된다.C가 매우큰 경우 잘못된 데이터에 매우 민감하다.C가 매우 큰 경우 잘못된 데이터에 민감하다.C가 작은 경우 이상치에 민감하지 않다.C 값이 너무 크지 않으..

인공지능/공부 2024.05.17
728x90
728x90