인공지능/공부

인공지능과 빅데이터 11 ~ 15주차 정리

이게될까 2024. 6. 20. 23:58
728x90
728x90

11주차 - 딥러닝 작업 환경 만들기, 기본 코드 실행하기

1차시 - 딥러닝 환경 만들기 1

딥러닝 프레임워크는 이미 검증된 알고리즘을 편히 다룰 수 있게 해주고, 테스트 코드를 실행할 수 있다.

딥러닝 실행을 위한 준비 사항
데이터 - 딥러닝은 데이터를 이용해 예측 OR 판별을 수행하는 컴퓨터다
컴퓨터 - 일반 cpu에서 동작시킬지 GPR에서 동작시킬지 선택
플랫폼 - Python, Tensorflow
프로그램 - 딥러닝 구동할 수 있도록 

 

2차시 - 딥러닝 작업 환경 만들기 2

딥러닝을 작동시킬 때 가장 많이 사용하는 언어는 아나콘다(환경 분리)를 사용한 Python이다.

 

3차시 - 테스트 코드 실행

아나콘다, Pycharm를 통한 다양한 테스트 진행

 

12주차 - 선형 회귀 모델링, 학습, Python 실습

1차시 - 선형 회귀 모델링

선형회귀 - input과 label간 직선 방정식으로 표현하기 
LOSS function, 최적화 필요 (정확한 모델 = 정확한 모델링 + 오차 작은 직선 + 오차 작은 a,b = 정확한 직선)

 

2차시 - 선형 회귀에서 경사 하강법

MSE = Mean Squared Error = 최소화 해야 한다. = 가장 대표할 수 있는 직선을 그어야 한다.

학습률 - 적절한 학습률 결정 중요하다.
a값을 업데이트 시키는 크기를 결정하는 파라미터
머신러닝, 딥러닝에서 최적의 학습률을 찾는 과정이 중요
학습률이 너무 작으면 최적 값에 도달하는 시간이 오래걸림
학습률이 너무 크면 최적 값을 못 찾을 수 있다.

배치
모든 데이터를 한번에 학습하는 활동은 값이 부드럽게 수렴하나 사이즈가 커지면 컴퓨팅 파워와 시간이 많이 소요된다

SGD
데이터를 하나씩 추출해서 처리하는 방식으로 경로가 일정하지 않을 가능성이 있지만 Batch 방법에 비해 짧은 시간이 소요된다.

Mini-batch
전체 데이터를 특정 사이즈로 나누어 순차 진행하는 방식으로 두 방법의 단점을 보완하고 장점을 부각시킨다.
Batch보다 빠르고, SGD보다 낮은 오차이다.

 

3차시 - 선형회귀 실습 

제곱하면 음수 제거를 통해 정확도를 향상한다.
평균을 하면 데이터 양에 상관없이 정확도를 유지한다.

 

13주차 - 데이터 전처리 이론, 실습

1차시 - 데이터 전처리 개요

데이터 탐색분석 과정 - 형식, 크기, 결측 값, 이상 값, 기초 통계 값 

딥러닝과 데이터
데이터가 적고 질이 좋다 = 원하는 모델링 불가
데이터가 많고 질이 나쁘다 = 정확도 향상 한계
양과 질이 많은게 중요하다. 좋은 데이터 == 모델링 대상의 특징을 잘 포함하는 데이터 

데이터 전처리 - 대량의 데이터를 정제된 데이터 형식으로 변환 
머신러닝 프로젝트의 첫 단계로 불 필요한 데이터들을 제거하고, 정제하여 핵심 데이터만 남긴다.
중요성 부각하고 관계없는 데이터를 제거하는 모델링이 필요하다!

Pandas를 활용하면 데이터 분석 및 전처리가 가능하다 

데이터 시각화 - 이해하기 쉽도록 시각적으로 표현하여 데이터를 잘 표현할 수 있고, 특징을 파악하기 좋다.
설명가능한 인공지능(XAI)을 통해 결과의 이유를 시각적을 제시할 수 잇따.

 

2차시 - 정형 데이터 전처리 실습 

정형 데이터 - 정리된 데이터 

Pandas를 통해 크고 많은 데이터를 불러들일 수 있다.

Matplolib, seaborn - 시각화에 쓰인다.

 

3차시 - 비정형 데이터 전처리 실습 

데이터 형식 유지는 필수!

FCN - 입력을 벡터로 변환 필요
Convolution - 이미지 자체 입력 가능

 

14주차 - 다중 퍼셉트론, 이진 분류

1차시 - 다층 퍼셉트론 설계 

퍼셉트론 - 신경망을 이루는 가장 중요한 기본 단위로 입력과 활성화 함수를 사용해 출력 값을 전달

선형회귀 = 활성화 함수 없는 단층 퍼셉트론 학습

다층 퍼셉트론 - 한개 이상의 hidden layer
심층 신경망 - 두개 이상의 hidden layer 

활성화 함수가 없으면 선형 회귀다 
다양한 비선형 경계를 만들어 줘 복잡한 문제를 해결할 수 있다. = 신경망은 대부분 사용한다.

XOR - 단층 퍼셉트론과 복잡한 활성화 함수로 찾을 수 있지만 비효율 적이다. = hidden layer에서 왜곡 발생
다층 퍼셉트론과 선형 활성화 함수 - 비선형 경계 효과 창출 
다층 퍼셉트론과 비선형 활성화함수 - 복잡도 증가할 수록 더 좋은 결과 창출 

오차 역전파 - 경사 하강법을 통해 오차가 작아지는 방향으로 업데이트 

 

2차시 - 정형데이터 이진 분류 실습 1 

데이터 로드 -> 트레이닝 -> 테스트 

Optimizer = 최적화 - Learning rate를 적당하게 만들어줌

Batch_size = 한번의 업데이트에 활용하는 데이터 양

 

3차시 - 정형 데이터 이진 분류

Train과 Test 데이터의 엄격한 구분이 필요하다.

초기값 랜덤이 결과값에 근소한 차이를 발생한다.

 

15주차 - 딥러닝, 다중 분류

1차시 - 정형 데이터 다중 분류

딥러닝 - 여러 layer를 가진 인공신경망을 사용해 머신러닝 학습을 수행한다.
컴퓨터가 자가학습하여 패턴이나 규칙을 학습하고 의사결정이나 예측한다.

 

2차시 - 비정형 데이터 다중 분류 실습 1

Test data는 모델 학습(개발 과정)에 사용하면 안된다!!

 

3차시 - 비정형 데이터 다중 분류 실습 2

GPU - 처리 속도 증가 

Drop out - 최종 성능을 끌어올린다.

Flatten - 2차원 데이터를 1차원 데이터로 변형한다.

728x90