사람은 경험을 통해 지혜로워진다.
머신러닝 - 데이터(경험)를 기반으로 모델을 학습하는 기술
최근에는 다향한 형태의 머신러닝 방법을 개발하고 있다 -> 신경망 기반 학습
신경망 기반 학습
컴퓨터가 스스로 특징을 결정하는 표현학습 가능한 것이다.
사람이 간과한 중요한 특징을 놓치지 않고 학습에 사용한다.
복잡한 특징들이 서로 혼합된 데이터 == 빅데이터
머신러닝의 학습방법 중 비지도학습과 강화학습 배우기!
표현학습 - 데이터의 특징을 컴퓨터가 자동적으로 추출 -> 머신러닝과 다른점
모든 사진에 레이블이 달렸기 때문에 지도 학습에 사용 가능한 것이다.
레이블이 없는 단순 데이터를 특징 끼리 묶어서 레이블을 만든다. 특정 기준을 만들거나 피쳐를 사람이 제공해 주면 컴퓨터가 클러스터를 만든다.
사과와 복숭아, 바나나가 섞여있는 사진에서 스스로 특징을 잡아서 3가지로 분류한다.
클러스터링 - 유사한 특성을 가진 그룹으로 묶는 작업
분류 - 지도 학습 -> 레이블이 되어있다.
클러스터링 - 비지도 학습
기준 선을 만드는 것이 분류이다.
클러스터링-> 벗어난 데이터를 탐지할 수 있다.
k-Means == 유사한 특징을 가진 k개로 묶기 -> 클러스터 개수가 k개
장점 - 비교적 간단하다. 속도가 빠르다. (계산량이 적다.)
파란점 18개를 2개의 클러스터로 묶는 프로세스를 진행할 것이다 -> 2개의 클러스터 중심점
랜덤이기 때문에 왼쪽으로 치우쳐져 있다.
왼쪽은 3개, 오른쪽은 15개로 클러스터링이 되었다.
이 과정을 반복하게 된다.
다시 가장 가까운 중심점에 할당한다. -> 또 군집에 맞게 중심 옮기기
이제 포인트인 경우에도 한번 진행해보자
최초 계획했던 대로 3개의 클러스터로 분리했다.
k를 어떻게 지정하는지가 고민될 것 같네요....
보상 - 값으로 주어진다. 의도한 행동이라면 +, 내가 원하지 않은 점수면 -
처음부터 어떻게 될 지 모른다. -> 여러가지 시도(액션)를 하게 된다. -> 보상이 쌓인다. -> 최적의 액션을 하도록(정책) 만든다.
그리드 월드에서의 길찾기도 예시로 볼 수 있다.
어디가 얼었고, 구멍인지 모른다 -> 시도하기
강화 학습의 응용 분야 ->보상이 주어지는 문제해결에 효과적
게임도 액션에 따른 결과로 나오기 때문에 강화학습이 많이 사용된다.
'인공지능 > 공부' 카테고리의 다른 글
인공지능과 빅데이터 5주차 3차시 - 단층 퍼셉트론의 한계와 다층 퍼셉트론 (0) | 2024.04.01 |
---|---|
인공지능과 빅데이터 5주차 2차시 - 신경망과 단층 퍼셉트론 (0) | 2024.04.01 |
딥러닝 개요 복습 2 (0) | 2024.03.28 |
강화학습 과제 1 최종 - N Step TD 구현하기 (12) | 2024.03.27 |
강화 학습 복습 2 (0) | 2024.03.27 |