머신러닝 3주차 2차시 - 특징 값 스케일링 내가 아는 스케일 - 값의 차이를 적당한 범위로 맞춰준다. 큰 값이 영향을 크게 주게 된다! 경사 하강법이 잘 적용되지 않을 수 있다. 그럼 최솟값이 안맞지 않나? Feature Scaling 밸런스를 가지도록 스케일링 한다! 평균 값을 빼주는 이유 : 특징 값이 좌우 균등하게 분포하도록! 스케일링 시 - 경사하강법이 빨라 질 수 있다. 분류 문제에서도 경사 하강법에 도움을 준다. 범위가 너무 다른 경우 적용한다! 인공지능/공부 2024.03.18
머신러닝 3주차 1차시 - 다 변수 선형 회귀 이전에는 엔진 파어만을 통해 자동차 가격을 예측했다. 비용함수를 최소화하는 값을 찾으면 그 값을 가설에 대입하면 끝이었다. 데이터는 205개가 주어졌다. cost function은 비슷하다. 그저 하나가 늘은 것 뿐이다. 변수가 여러가지라면 벡터로 표현하면 편하다. w*는 최적 값이다. 경사 하강법 변수가 한개일 경우 변수가 2개 이상일 경우 특징의 개수 - n 학습 데이터 개수 - m 데이터의 총 개수는 205개이다. w0는 바이어스 파라미터이다. -> x에 1을 하나 추가해준다. 이 것도 벡터화 시킬 수 있다. 우리 x0 = 1로 만들어서 굳이 안나눠도 되지 않나...? 인공지능/공부 2024.03.18
인공지능과 빅 데이터 3주차 3차시 - 규칙기반 시스템, 전문가 시스템 규칙 기반 시스템 - 특정 문제 해에 대한 전문가적인 답변을 준다. 정형화에는 규칙이 들어간다. 지식 베이스 - 사전에 알게된 정보 추론 규칙 - 지식 베이스를 기반으로 모르는 정보에 대한 정보를 알려준다. 추론 과정을 볼 수 있다. 추론을 통한 탐색 순방향 추론 = 방향성이 순 방향이다. 조건부 - 주어진 상황의 매칭 (많아지면 연산에 무리가 간다.) 역방향 추론 결론부부터 확인한다. 가설 - 사실을 가정한다. 순방향 추론 시작! 왼쪽은 조건부가 된다. 이번엔 역방향 추론으로 간다. 이 것을 보고 치타라는 가설을 세울 수 있다. 여기서 확인도 치타이다 부터 확인하기 시작한다. 전문가 시스템 Expert System - 전문가의 추론 과정을 시스템으로 옮긴 것이다. 질병 진단 전문가 시스템을 활용 -> .. 인공지능/공부 2024.03.18
인공지능과 빅 데이터 3주차 2차시 - 지식 표현과 추론, 지식 표현의 불확실성 논리를 이용한 지식 표현과 추론 명제 논리 - 참 거짓을 분명하게 판정할 수 있는 문장 논리 합, 곱, 부정 나오네요 술어 - 대상의 속성이나 대상 간의 관계를 함수 형태로 나타낸다. 인공지능은 논리를 바탕으로 추론해야 한다. 규칙을 이용한 지식 표현과 추론 규칙의 나열 - 조합하여 그래프로 표현할 수 있다. 그래프 표현이 직관적이고 쉽다. 의미망을 이용한 지식 표현과 추론 직접적인 연결은 없어도 상위 개념을 통해 연결되어 있다면 가능하다고 볼 수 있다. 팽귄이면 조류다. 조류는 알을 낳는다. 지식이 풍부해질 수록 연결이 더욱 많아진다. 지식을 그대로 글로 표현한 것은 활용하기에 굉장히 어렵다. 지식 표현의 불확실성 오리너구리가 예시가 될 수도 있겠네요 복잡한 대상, 지식 표현은 불확실한 것이 분명히 있.. 인공지능/공부 2024.03.18
인공지능과 빅 데이터 3주차 1 - 규칙 기반 시스템, 지식 기반 시스템 마이신 - 혈액 감염 진단과 치료를 위한 처방을 목적으로 하는 의학 전문가 시스템 의사 없이도 진단 및 판단을 한다. 규칙 기반 시스템의 대표적인 예시이다. 머신러닝 = 많은 데이터에서 규칙을 찾는다. 사람이 디자인 한다! -> 그럼 그게 인공지능인가? 주입하지 않은, 학습하지 않은 상황에 대해서도 대처를 한다. 스스로 추론을 통해 알아낸 것이다. 머신러닝은 데이터를 먼저 접근한다. 우유를 많이 먹었다면 그렇다라고 하겠죠 아주 단순한 기술엔 단순 프로그래밍 구현으로도 충분하다. 고차원 기능, 판단이 필요한 문제엔 AI가 활용된다. 딥페이크, 수많은 데이터 수집을 하기엔 Rule based AI를 활용하기엔 무리가 있다. 지식 - Rule based AI를 구축하는데 기반이 된다. 이것도 강화학습처럼 경험.. 인공지능/공부 2024.03.18
딥러닝 개론 복습 1 딥러닝은 깊은 신경망이 있다는게 특징입니다. 이렇게 봐도 너무 애매한데 이럴때 GPT죠 여우와 토끼 사진을 구분한다고 할 때 머신러닝은 인간이 사진을 보고 사진에서 토끼의 귀 길이, 여우의 귀 길이, 색, 크기 등을 컴퓨터에 입력해줘야 하는거고 딥 러닝은 사진만 던져주면 알아서 하는거야? 네, 맞습니다! 머신러닝과 딥러닝을 여우와 토끼의 사진을 구분하는 상황으로 비교하면, 다음과 같이 설명할 수 있습니다: 머신러닝에서는 사람이 특징(feature)을 직접 정의하고 추출해야 합니다. 예를 들어, 여우와 토끼를 구분하기 위해 사람이 귀의 길이, 색, 크기 등을 사전에 정의한 특징으로 결정하고, 이 데이터를 기반으로 컴퓨터가 학습하여 여우와 토끼를 구분하게 됩니다. 이 과정에서 중요한 것은 얼마나 유의미하고 .. 인공지능/공부 2024.03.14
생성형 인공지능 - 복습 1 with GPT4 1 주차 - 1 CHAT GPT는 LLM이며 Generative Pre-trained Transformer이다. Query기반으로 텍스트 응답을 형성한다. 트렌스포머 디코더 모델 기반이다. 트렌스포머 Transformer는 글자를 번역한다는 의미다. Masked Multi-Head Self Attention Masked Multi-Head Self Attention은 트랜스포머 모델에서 사용되는 기술 중 하나로, 특히 디코더 부분에서 중요한 역할을 합니다. 이 기법은 입력 시퀀스 내의 각 단어가 자신보다 뒤에 오는 단어들에 대한 정보를 '보지 못하도록' 마스킹 처리하는 과정을 포함합니다. 이를 통해 모델이 미래의 단어를 예측하는 과정에서 정보 누설을 방지합니다. Multi-Head Self Attenti.. 인공지능/공부 2024.03.12
강화학습 - 복습 1 with GPT4 뭔가 이 것만 가지고는 강화학습의 필요 이유를 확실하게 알기 어렵다. 둘다 OK이다. 즉 지도 학습은 정답이 있는 상태에서 학습하는 것이고, 강화 학습은 내가 경험을 통해 스스로 학습하는 것이다. 음 그럼 이게 RNN과 차이가 뭐지...? 순차적 의사결정 문제해결 방식과 순환 신경망(RNN)의 주요 차이점은 그들이 해결하려는 문제의 유형과 사용되는 접근 방식에 있습니다. 순차적 의사결정 문제해결 방식: 순차적 의사결정 문제는 강화학습(RL)과 같은 학습 알고리즘에서 자주 볼 수 있으며, 에이전트가 환경과 상호 작용하면서 최적의 의사결정 전략을 학습하는 과정입니다. 이러한 접근 방식에서는, 에이전트는 현재 상태에서 어떤 행동을 취할 때 받게 되는 보상을 최대화하기 위해 행동을 선택합니다. 목표는 최적의 정.. 인공지능/공부 2024.03.12
머신러닝 퀴즈 2 아래 문장의 빈칸에 들어갈 가장 적절한 단어를 고르시오. “선형 회귀는 주어진 데이터 𝑥에 대한 예측 함수 𝑦=ℎ(𝑥)가 (________)이며, 데이터에 예측 함수를 적합시키는 (________) 학습 알고리즘이다.” 하나를 선택하세요. 직선, 지도 직선, 비지도 곡선, 지도 곡선, 비지도 선형이므로 직선이고, 라벨이 붙어있는 즉 정답이 있는 지도학습입니당. 선형회귀는 예측함수가 y = w0 + w1 x의 형식이므로, 함수의 모양이 "직선" 이며, 선형회귀에서 사용하는 학습 데이터는 (입력,출력)의 형식으로 되어 있으므로 "지도학습" 알고리즘입니다. 정답 : 직선, 지도 비용 함수에 관한 다음 설명 중에서 올바른 것을 모두 고르시오. 하나 이상을 선택하세요. 1. 비용 함수는 회귀 모델의 성능을 계산하.. 인공지능/공부 2024.03.12
머신러닝 퀴즈 1 다음 중에서 지도 학습 알고리즘을 가장 적절하게 사용할 수 있는 응용 예는 무엇인가? 하나를 선택하세요. 1. 어떤 소비자가 구매한 물품에 대한 기록을 이용하여, 그 소비자가 함께 구매할 가능성이 높은 물품들에 대한 패턴을 발견하고자 함 2. 어느 회사의 최근 5년간 주식 가격 데이터를 이용하여 내년 특정한 시기에 그 주식의 가격이 얼마가 될지 예측하고자 함 정 답 피드백 지도 학습이란 정답이 주어진 학습데이터를 이용하여 컴퓨터가 주어진 입력에 대한 올바른 결과를 예측하도록 학습하는 과정입니다. 과거 데이터를 학습하여 미래의 값을 예측하는 문제는 지도 학습 알고리즘을 효과적으로 사용할 수 있는 응용문제 중 하나 입니다. 정답 : 어느 회사의 최근 5년간 주식 가격 데이터를 이용하여 내년 특정한 시기에 그.. 인공지능/공부 2024.03.12