반응형

인공지능 665

모두를 위한 머신러닝 10주차 4차시 - 정밀도와 재현율의 Trade - off

정밀도와 재현율의 균형!우린 정확히 0.5로 나누기로 했다.높은 확률을 암이라고 판단한다!프리시전은 높이고, 리콜은 낮춘다.임계값!반비례한다.임계값을 자동으로 설정할 순 없을까?평균을 통해 판단할 수 있다.이제 T였나 무슨 스코어 였는데 F1이었네요적절히 균형을 맞춘 알고리즘이다.F1은 조화평균이다!F1 score도 커야지 좋은 지표이다.

인공지능/공부 2024.05.09

모두를 위한 머신러닝 10주차 3차시 - 불균형 데이터의 경우 오차 평가 척도

불균형 데이터 == 데이터의 수가 크게 차이나는 것이렇게만 만들어도 정확도가 99.5%!!!불합리한 결과는 데이터의 부류 내에 데이터의 개수가 매우 차이 나기 때문에 발생!!극단적인 경우를 skewed Classes라고 부른다.그냥 정확도를 확인하는게 좋은 척도가 아니다.단지 정확도가 올랐다고 성능이 좋아졌다고 하기 어렵다. 다른 척도가 필요하다.혼동 행렬(confusion matrix)이라고도 많이 불렀던 것 같네요정밀도 - 참이라고 예측한 경우 중 진짜 참인 경우재현율 - 참인 중에 참이라고 예측한 경우 (이게 암 환자한테 중요하다고 느끼네요..)재현율이 0이 되어 버렸다.정확도는 단지 데이터의 불균형 때문이었다. 에러는 이걸 반대로 하면 된다.진짜 부정 중 예측을 부정으로 한 경

인공지능/공부 2024.05.09

모두를 위한 머신러닝 10주차 2차시 - 오차 분석 방법

만약 더 많은 데이터, 특징들을 수집했을 때 도움이 되는지 확인하기 위해서 학습 곡선을 그려보는 것도 좋다. 스팸 분류기를 다시 생각해보자100개의 에러가 어떤 형태의 애러인지 확인해야 한다.그리고 대처할 수 있도록 새로 수정해야 한다.약을 파려는 건지, 개인정보 수집인지 등을 확인해야 한다! 32가지의 맞춤법 오류를 확인하여 적중률을 향상할 수 있다. 어원(어근)이 중요한 요인이 될 수 있다. 수치 평가 척도를 이용하면 성능 향상 시도가 얼마나 효과 있었는지 알수 있다! validation을 통해 알고리즘의 성능 향상을 확인할 수 있다.오차 분석을 통해 성능 향상의 방법, 다른 아이디어의 적용의 성능을 평가 할 수 있다.

인공지능/공부 2024.05.09

모두를 위한 머신러닝 10주차 1차시 - 머신러닝 시스템 설계 시 고려사항

질병의 발병률이 1%라고 생각하자!모두 음성이라고 추측하면 99%의 정확도를 가지게 된다....이것은 불균형 데이터이다. 시스템을 향상시키기 위해 고려해야할 3가지!스팸 골라내는 프로그램을 통해 알아보자이진 분류!스팸 메일은 물건을 팔고자 하거나 홍보를 하는 메일이고, 우리가 모르는 곳에서 보낸 메일이다.지도학습 머신러닝 알고리즘을 통해 만들 수 있다.특징 차원은 100차원이 된다.오 가짜 이메일 주소 만드는 건 좀 괜찮네스페머들은 이걸 애매하게 만들기도 한다.이런 데이터를 통해 정보를 얻을 수 있다.컴퓨터가 매칭할 수 없도록 이상하게 작성한 단어를 찾아내는 알고리즘도 만들어야 한다.GPT 겁나 경량화 해서 넣으면 엄청 잘할거 같은데,,,

인공지능/공부 2024.05.09

이전부터 살짝 아리까리 했던 RNN 정리하기

RNN은 기본적으로 시계열 데이터를 예측할 때 사용된다고 한다.그런데 인공지능을 만드는데 사용하면서 항상 애매했다...이 친구의 input, output이 어떻게 되는지내부 구조는 아는데 명확하게 계산이 어떻게 되는지를 정립을 못하고 있었다.2023.12.15 - [인공지능/공부] - 시계열 데이터(주가, imu data) 예측 인공지능 - RNN, LSTM 시계열 데이터(주가, imu data) 예측 인공지능 - RNN, LSTMRNN은 시간에 따라 변화하는 데이터를 얘측할 때 사용된다. stationary( 변화없는 )데이터 NON - stationary 데이터 둘 중에 무엇이든 이러한 데이터들은 이전의 값들이 필요하다. 그러나 CNN, FCN을 사용하yoonschallenge.tistory.com ..

인공지능/공부 2024.05.09

matlab 강화학습 onramp 6 - 에이전트 정의하기 , 신경망으로 크리틱 표현하기

상태와 행동이 많으면 Q테이블이 엄청 커진다.그리고 상태와 행동이 연속적인 값이라면 어떻게 해야 할까요?딥뉴럴넷을 활용하여보자 주사위 게임을 위한 신경망 기반 에이전트상태와 행동이 각각 20개와 5개에 불과한 주사위 게임은 Q-테이블 에이전트로 잘 표현할 수 있습니다. 그러나 상태와 행동이 더 많은 경우에는 크리틱을 표현하기 위해 테이블 대신 신경망을 사용할 수 있습니다. 사실 이러한 간단한 문제에 신경망을 사용하는 것이 지나치기는 하지만, 이 활동에서는 주사위 게임을 위한 심층 Q-신경망(DQN)을 만들어 보겠습니다. 관측값 사양과 행동 사양만을 입력값으로 지정하여 적절한 rl*Agent 함수(여기서 와일드카드 "*"는 DQN과 같은 에이전트 유형으로 대체됨)를 호출해 에이전트를 만들 수 있습니다. a..

matlab 강화학습 onramp 5 - 에이전트 정의하기 ,Q 테이블 시각화하기

액터는 여러 에피소드를 거치면서 정책을 개선한다.어떻게 정책을 개선할까?크리틱은 얼마나 적합한가 판단한다. 가치를 어떻게 판단하냐?반복하며 추정을 할 수 있게 된다. 탐색이 요구되는 것이다.입실론 그리디를 통해 랜덤 한 값을 탐험하기도 한다.Q테이블을 만들어보자! 더보기Q 테이블에는 관측 가능한 각 상태에 대한 행과 허용되는 각 행동에 대한 열이 있습니다. rlTable 함수를 사용하여 Q-러닝 RL 에이전트에 대한 Q 테이블을 만들 수 있습니다. T = rlTable(states,actions) 여기서 states와 actions는 rlFiniteSetSpec으로 만든 환경 인터페이스입니다. 작업 rlTable 함수를 사용하여 주사위 게임에 대한 T라는 Q 테이블을 만드세요. 관측 가능한 상태는 변수 ..

matlab 강화학습 onramp 4 - 보상에 행동 포함하기

보상에 행동을 포함시킬 수 있다.주행과 브레이크를 반복적으로 하는게 아니라 가속을 최소화 해야되는 것과 같다.여기서 시차 오류가 발생하는데 유닛 딜레이를 사용해서 오류를 없앨 수 있다. 창고 로봇의 활동 줄이기전략을 세울 때는 대개 가능한 한 적은 수고를 들여 목표를 달성할 수 있는 방법을 찾습니다. 예를 들어 로봇의 행동은 병진력과 회전력이며 배터리 에너지를 소모합니다. 따라서 가급적 불필요한 행동을 하지 않도록 만들면 배터리 부하를 줄이고 한 번의 배터리 충전으로 로봇이 더 많은 일을 수행할 수 있습니다.이제 Simulink 모델에서 제어기의 행동이 (Unit Delay를 거쳐 그 행동이 야기한 새로운 상태 관측값과 짝을 맞추어) 보상 함수에 다시 전달됩니다. 이는 행동이 보상 계산에 포함될 수 있다..

matlab 강화학습 onramp 3 - 환경 정의하기

정책 - 주어신 상황에서 행동을 정한다.목표에서 보상함수를 만든다.에이전트는 행동을 선택하고 그 행동에 대해 상태가 변한다. 환경은 보상을 준다.훈련을 통해 더 많은 보상을 받도록 변한다. 창고 로봇에 대한 보상 설계하기보상 함수는 로봇이 선반 사이의 공간 쪽( (x,y)=(0,0))으로 이동한 다음 틈새를 통해 아래쪽( y아래에 그래프로 표시된 함수는 각 차원에서 독립적으로 이 목표를 달성합니다. 이 활동에서는 이러한 사항에 기반하여 보상 함수를 설계합니다.  더보기초기화 코드는 meshgrid 함수를 사용하여, (x,y) 점 그리드를 표현하는 행렬을 만듭니다. 또한 행렬 x와 y는 값이 범위 [-1,1] 내에 있도록 10배만큼 축소되었습니다. 힌트 exp 함수와 표준 MATLAB 산술 연산을 사용하여..

matlab 강화학습 onramp 2 - 강화 학습 모델의 구성 요소

게임을 잘 하려면 여러가지 시도를 통해 학습을 해야한다.에이전트는 환경과 상호작용하며 게임의 참가자이다.환경은 관측치를 에이전트에게 넘겨준다.에이전트는 액션을 통해 환경을 변화할 수 있다.여기서 환경은 시뮬링크 모델을 통해 시뮬레이션 된다.모든 값들은 Matlab에서 변수로 표현된다.에이전트, 환경, 관측값, 행동은 모두 MATLAB에서 변수로 표현됩니다.관측값과 행동을 정의할 방법을 지정하려면 rlNumericSpec 함수 또는 rlFiniteSetSpec 함수를 사용합니다. 관측 가능 상태 또는 가능한 행동으로 구성된 유한 집합이 있는 경우에는 rlFiniteSetSpec을 사용합니다. 관측값 또는 행동이 유한 집합을 형성하지 않는 숫자형 값으로 지정된 경우에는 rlNumericSpec을 사용합니다...

728x90
728x90