반응형

2024/04 154

강화 학습 정리 - 3강 벨만 방정식

R- 보상, 리워드 G - 리턴 v - 상태 가치 방정식 q - 액션 가치 방정식 E - 평균 취하기 * - 최적 값 t - 상태 시간 단위 (k 보다 작은 시간인데 이전에서 나왔던 시간의 개념과 똑같다.) k - 에피소드 시간 단위 평균은 어디? - 어차피 마지막에 평균있어서 ㄱㅊ 항상 성립하는 것은 아니다 v(s) != v(s')이기 때문 v : s에 대한 리턴의 기댓값 액션이 추가되었다. v(특정 s의 가치)와 q(특정 s에서 a를 취했을 때 가치)의 관계 모델 프리 : 결과는 얻어지나 어떤 값으로 계산되는지 모르는 경우 v와 q의 선택은 목표에 따라 다르다. 어떤 위치에 도달해야 한다. S를 변화해야 한다. S를 예측할 수 없다. -> q를 사용한다. s'을 모를 때 q(s,a)를 대신해서 사용한..

인공지능/공부 2024.04.20

강화학습 정리 - 1강 강화학습이란?

지도 학습 - 정답 비지도 학습 - 목적 함수 강화 학습 - 보상의 총합 최대화 -> 보상이 학습을 가능하게 해준다. 누적합 - 시간의 흐름에 따라 보상이 쌓인다. 끝나면 그게 하나의 에피소드이다. 에이전트 - 게이머, 사람 환경 전체를 이해하고 모델링 할 수 있다. -> 굳이 강화학습 사용하지 않아도 된다. 환경이 너무 복잡해서 일부만 쓴다. -> state, 간소화해서 모델링 한다.

인공지능/공부 2024.04.20

강화학습 정리 - 2강 마르코프 프로세스

모든 상태를 행렬로 포함한다. - 행별로 쭉 더해서 1이 되는지 확인 확률로 정의하는데 t 이전의 과거는 필요없다! -> 메모리 감소 효과도 있다. 체인 룰에 의해서 다음을 계속 예측할 수 있다. 모든 상황이 마르코프 상태가 맞는 것은 아니라 정답이 아닐 수 있다. 그러나 모델링은 가능하다! 자율주행에서의 현재 상태 == 한 장만으로는 판단할 수 없다. - 10초간의 여러 사진을 하나로 볼 수 있다. 감쇠인자를 통해 미래 보상의 불확실성을 표현할 수 있따. 리턴의 정의 : 특정 시점, 상태에서의 리워드 합 G: 리턴, R: 보상, S: 상태 리턴(G)가 과도하게 커지면 프로그램의 숫자 표현형을 넘길 수 있고, 게임이 안 끝날 수 있다. 가치(V) != 리워드(R)! 내가 미래에 무엇을 받을 지 모르니 기..

인공지능/공부 2024.04.20

C언어 영상 처리 - Gamma

사람 눈은 카메라처럼 1픽셀 단위로 따박따박 인식 X오차가 있다.어두운 부분을 좀 더 세밀하게 나눌 수 있다고 볼 수 있다. -> 어둠에 민감!감마 인코딩을 거치면 훨씬 잘 나뉘어 보인다.8비트이므로 우린 MAX = 255이다.전파의 수, 송신 오류로 감마가 변하거나 센서의 부족함으로 감마가 입혀졌어도 다시 되돌릴 수 있다.함수형으로 전부 바꾸는중이라 점점 단순해지는중..void GammaOut(double* y, double g, BITMAPFILEHEADER bmpFile, BITMAPINFOHEADER bmpInfo) { int width = bmpInfo.biWidth, height = bmpInfo.biHeight, size = bmpInfo.biSizeImage; double* gy; gy =..

언어/C 2024.04.18

C언어 영상처리 예정

패딩 - 반사 패딩, 엣지 패딩 등 좀 더 다양하게 알아보기 영상처리에서 필터를 적용하기 전에 사용하는 패딩에는 다양한 종류가 있습니다. 아래에서 몇 가지 패딩 방법을 설명해드리겠습니다: Nearest Padding (가장 가까운 픽셀 복사): 이미지의 가장자리에 있는 픽셀을 복사하여 패딩합니다. Zero Padding (0으로 픽셀 테두리 값 채우기): 이미지의 테두리 값을 0으로 채워 패딩합니다. 주로 컨볼루션 연산에서 사용됩니다. Reflection Padding (반사 패딩): 이미지의 가장자리 값을 반사하여 패딩합니다. 이 방법은 이미지 경계를 부드럽게 처리하는 데 도움이 됩니다. Edge Padding (엣지 패딩): 이미지의 가장자리 값을 가장 가까운 픽셀 값으로 채워 패딩합니다. Const..

언어/C 2024.04.17

C언어 영상처리 다양한 필터

이미지 처리에서 사용할 수 있는 다양한 필터들이 있으며, 각각 특정 종류의 노이즈와 상황에 따라 장단점이 있습니다. 여기서 몇 가지 일반적인 필터들을 소개하고, 각각의 용도와 추천 상황에 대해 설명하겠습니다. 1. 평균 필터 (Mean Filter) 설명: 주변 픽셀의 평균 값을 사용하여 현재 픽셀 값을 대체합니다. 장점: 간단하고, 연산 속도가 빠릅니다. 단점: 에지(edge)가 흐려질 수 있으며, 극단적인 노이즈에는 효과가 제한적입니다. 적합한 사용 경우: 이미지에서 무작위 노이즈를 감소시키고 싶을 때, 그러나 에지 보존이 중요하지 않은 경우. 2. 미디언 필터 (Median Filter) 설명: 주변 픽셀들을 크기 순으로 정렬한 후 중앙값을 선택하여 현재 픽셀을 대체합니다. 장점: 솔트 앤 페퍼 노..

언어/C 2024.04.17

생성형 인공지능 특강

생성형 인공지능 - 어마어마하게 많은 GPU가 필요하다. 달리나 chat GPT - 몇 만개의 GPU사용 ? 다양한 생성 AI가 있다 - 비디오, 텍스트, 사진, 음악 등 자율 주행, 로봇, 드론 등 모든게 AI로 진행되고 있다. ...? 들어오는 것 인식 -> Encorder에서 담당한다. (얼굴 인식 등 Convolution도 인코더와 비슷한 느낌이다) Decorder - 발생 - GPT도 디코더 모델! 컴퓨터 vision(영상처리)의 발전 - 자연어 처리에서 나왔다. Transformer? RNN? 토큰화화 후 자연어를 컴퓨터가 인식할 수 있는 embedding 벡터로 변환 embedding - LSTM과 RNN이 했었다. 길면 죽어! Transformer - 길어도 상관없다. 행렬의 크기만 하드웨..

인공지능/공부 2024.04.17

자연어 처리 중간고사 전 마지막 작성

ELMo (Embeddings from Language Models)는 양방향 LSTM(Long Short-Term Memory)을 기반으로 한 딥 러닝 모델로, 주된 목적은 문맥에 따른 단어 임베딩을 생성하는 것입니다. ELMo는 특정 단어에 대한 임베딩을 생성할 때 단어가 사용된 문맥을 고려하여, 이를 통해 같은 단어라도 다른 문맥에서 다른 의미를 가질 수 있음을 반영합니다. ELMo의 주요 특징과 동작 방식 양방향 LSTM 구조: ELMo는 양방향 LSTM을 사용하여 문장을 처리합니다. 이 구조는 문장의 앞뒤 문맥 모두를 고려하여 각 단어의 의미를 파악할 수 있게 해줍니다. 이는 한 방향으로만 처리하는 일반적인 RNN이나 LSTM과 비교했을 때, 보다 풍부한 문맥 정보를 포착할 수 있는 장점이 있습..

기타 2024.04.17

GPT로 자연어 처리 퀴즈 만들기 2 - embedding, transformer, text mining

PDF 내용을 기반으로 딥러닝과 관련된 10개의 퀴즈 문제와 각 문제에 대한 해설을 준비했습니다. 이 문제들은 딥러닝의 기본 개념, 아키텍처, 기능 등을 다룹니다. 퀴즈 문제와 해설 퀴즈: 딥러닝에서 '활성화 함수(activation function)'의 역할은 무엇인가요? 답: 신경망의 각 노드(뉴런) 출력에 비선형성을 도입하는 것입니다. 해설: 활성화 함수는 신경망의 각 뉴런에서 계산된 선형 합을 입력으로 받아, 비선형 결과를 출력하여 다음 레이어로 전달합니다. 이 비선형성은 딥러닝 모델이 복잡한 문제를 해결할 수 있게 해줍니다. 퀴즈: '역전파(backpropagation)' 과정에서 주로 사용되는 최적화 알고리즘은 무엇인가요? 답: 경사 하강법(Gradient Descent) 해설: 역전파는 네트..

728x90
728x90