반응형

인공지능/공부 281

강화 학습 복습 2

1강 - 강화학습이란 강화학습 = Trial and Error을 통해 학습하는 방법 순차적 의사 결정 문제 = 시간 순서대로 주어진 상황에서 목적에 도달하기 위한 행동을 취하고, 그에 변화한 상황을 근거로 다시 행동을 취한다. 보상 == 피드백 = 의사 결정을 했을 때 잘 했는지 못했는지를 알려주는 수치(스칼라 값) 보상은 지연될 수 있으며, 어떤 행동으로 인해 보상으로 주어졌는지 판단을 나중에 할 수 있다. 강화학습 목적 = 누적 보상의 최대화 에이전트 == 학습자 = 현재상황 St에서 At를 결정한다. 그럼 그에 따른 보상 R(t+1)을 받고 다음 상태S(t+1)의 정보를 받는다. 환경 = 에이전트를 제외한 모든 요소 강화 학습의 장점 - 병렬성, 자가학습 2강 - 마르코프 결정 프로세스 마르코프 프..

인공지능/공부 2024.03.27

생성형 인공지능 퀴즈 4

1. 다음 문제 중 올바르지 않는 것을 고르시오. 자기주의(Self-Attention)의 이점 아닌것은? 하나를 선택하세요. 1.장거리 종속성 파악 2.병렬처리 3.확장성 4.이중 모드 애플리케이션 으음...? 병렬 처리가 된다고 했고, 장거리 종속성 파악도 된다고 했고, 병렬 처리== 이중 모드 애플리케이션 아닌가? "이중 모드 애플리케이션"은 자기 주의(Self-Attention)의 이점과는 직접적인 연관이 없는 선택지입니다. 자기 주의 메커니즘의 주된 이점은 다음과 같습니다: 장거리 종속성 파악: Self-Attention은 입력 시퀀스 내의 임의의 두 위치 간의 직접적인 관계를 모델링할 수 있기 때문에, 문장이나 시퀀스 내에서 멀리 떨어진 요소들 간의 관계를 학습할 수 있습니다. 이는 특히 긴 문..

인공지능/공부 2024.03.27

생성형 인공지능 4주차 Transformer 3차시 - Self-Attention 2 자기 주의

문맥을 포함할 수 있다...? 대량, 병렬처리 가능 번역, Q&A 등 여러가지가 가능하다. 1. Long range Association Dependency : RNN, LSTM, GRU의 단점을 보안 2. Context 문맥 잘 이해 3. 각자 프로세스가 따로 놀아도 된다. -> 대용량 빠른 처리 가능, 여러 사람이 동시에 사용 가능 가변길이 -> LSTM에서는 패딩을 사용했지만 여기선 안그래도 된다. 계층구조 -> CNN과 유사한 구조를 가지고 있다. Pre- Traning = 내가 이미 학습된 것을 파인튜닝하여 사용할 수 있다. Multi modal = 다양한 input을 엮어서 보내준다. 해석 가능 =다른 모델은 Weight을 봐도 의미가 없지만 Self- attention은 Weight의 흐름이..

인공지능/공부 2024.03.26

생성형 인공지능 4주차 Transformer 2차시 - Self-Attention 1 자기 주의

항상 어려웠던 이 부분... https://www.youtube.com/watch?v=6s69XY025MU&t=1322s&pp=ygUWdHJhbnNmb3JtZXIsIGF0dGVudGlvbg%3D%3D 이 유튜브가 찐으로 잘 설명해줍니다... 컴퓨터가 어디에 attention을 주냐 안주냐에 관심! 누구한테 관심을 얼마만큼 주냐 => Self Attention 주어진 모델 - Head -> 모든 head를 다 더하면 multi head attention RNN -> LSTM -> GRU -> Transformer information retirval == 내가 query를 줬을 때 키 key 값이 있고, 그것에 대한 value를 찾겠다. 문장 내의 연관 관계를 따지는데 q,k,v를 통해 문장 내의 cont..

인공지능/공부 2024.03.26

생성형 인공지능 4주차 Transformer 1차시 - 워드 임베딩 word embedding

워드 임베딩 - 단어의 벡터화 tf- idf도 나오고 tf도 나오고 다 하겠네요 고차원 백터 공간 - 다차원으로 양이 많다. High demensional vector space 워드 임베딩 == 백터를 표현하는데 중요한 역할, 단어간의 의미 관계 Dimensionality - 차원을 축소시켜 의미를 함축시킨다. representation learning은 중요하다! 그저 그 Index에 1을 표현해주는 것일뿐 차원이 엄청나게 커지지만 의미를 크게 갖지 못한다. 단어의 빈도를 벡터화 -> 어순과 문맥을 다 먹어버려서 다 섞여있어도 똑같은 빈도로 존재하면 똑같이 볼 것이다. 중요한 단어를 잡아내는 역할을 할 수 있지만 이것도 결국 문맥은 다 사라진다. idf - 적게 나오지만 중요한 단어 tf - 그냥 많..

인공지능/공부 2024.03.26

머신러닝 과제 1

4주차 과제 학습은 잘 하셨나요? 과제를 통하여 학습한 내용을 다시 한 번 확인해 보시기 바랍니다. 과제는 강좌 이수를 위한 평가 점수에 반영되며, 제출 기한은 4월 7일(일) 23시 59분 까지 입니다. [과제 내용] 2차원 특징 공간 상에서 다음과 같이 2개의 부류 (y = 1, y = 0)에 속하는 6개의 데이터들이 주어졌을 때, 이 데이터들을 학습 데이터로 하여 임의의 데이터들을 2개의 부류로 분류하는 분류기를 설계하려고 한다. 다음 질문에 답하시오 ( (1) 파라미터의 초기값을 으로 하였을 때, 로지스틱 회귀의 hypothesis 함수를 수식으로 표현하고, 다음 표의 빈칸을 채워 완성하시오: ( (2) 다음 표의 빈칸을 채워 완성시키고, 비용 함수 의 값을 계산 하시오: ( (3) 학습 상수를 ..

인공지능/공부 2024.03.26

머신러닝 퀴즈 4

1. 다음 중 이진 분류 문제에 해당하는 것은 무엇인가? 하나를 선택하세요. 1. 어느 고객의 취향에 가장 잘 맞는 S전자 회사의 스마트폰 모델을 추천하기 2. 어느 고객이 S전자 회사의 스마트폰을 구입할 것인지 아닌지 예측하기 3. 1개월 후 S전자 회사의 주가를 예측하기 정답은 2! 애초에 나머지들은 선택지가 2개인 것도 아니야.... 이진 분류 문제는 두 개의 클래스 중 하나로 분류하는 문제를 말합니다. 주어진 옵션 중에서 "어느 고객이 S전자 회사의 스마트폰을 구입할 것인지 아닌지 예측하기"는 고객이 스마트폰을 구입할지 아닐지, 즉 '구입'과 '구입하지 않음'의 두 가지 클래스 중 하나로 분류하는 문제입니다. 따라서 이는 이진 분류 문제에 해당합니다. 정답: 어느 고객이 S전자 회사의 스마트폰을 ..

인공지능/공부 2024.03.25
728x90
728x90