인공지능/공부

딥러닝 개론 정리 7강 - 합성곱 신경망 2 CNN

이게될까 2024. 4. 21. 16:32
728x90
728x90

이미지가 복잡할 수록 여러 단계를 거쳐야 한다.

 

필터에 좀 더 집중하였다. - 특성을 병렬로 뽑아내기, 압축하기
그룹핑하여 병렬처리하기

Alex - net

GPU성능이 낮아서 한개로 못 돌리기 때문에 물리적으로 GPU 구분하기

패딩과 스트라이드를 적절히 사용해서 크기를 조절했다.

한쪽은 형태를 학습하고, 한 쪽은 색상을 학습했다. 

 

 

 

 

최대한 깊게 학습해보자!

표가 3장이나 되어서 생략
그런데 깊다고 좋은게 맞나? -> google net

 

단순히 깊은 것 보다 필터를 여러 크기로 다양하게 사용하여 여러가지 패턴을 병렬로 처리할 수 있게 되었다. 

아직도 깊다...

 

기울기 소실과 longterm dependency 문제 !

깊다고 좋은 것 아니다!

깊지 않아도 학습을 효과적으로 만들어 준다. 

더하지 않고 concat하면 파라미터의 수가 증가하게 된다.

short cut 의 추가로 성능이 향상되었다.

결국 너무 깊어지면 성능이 떨어진다.

병목 블록 - 채널 수를 조정하여 파라미터와 복잡도를 감소시킨다.

크기가 다르다면 short cut에 convolution을 추가하여 사이즈를 맞출 수 있다.

 

이미지 인식을 위한 신경망

인식= 분류 + 위치 정보

1번에 처리하냐 vs 2번에 나눠서 처리하냐

분류하는 영역은 CNN과 같고, 후보 영역 추출하는 방식이 다른 것이다. 

객체마다 크기가 다른데 의미있는 영역을 어떻게 뽑을 것인가?

일단 잘게 쪼갠다

값이 비슷한 픽셀들과 합친다.

후보군 각각에 대해 CNN 진행한다.

Fast- 한번에 진행한다.

CNN 적용 후 바운딩 박스를 만들겠다!

 

박스 별로 점수를 메긴다

 

이미지 분할을 위한 신경망

short cut - 사이즈가 같아야 한다. 
줄였다가 키운다 == 대칭형으로 사이즈가 같다 -> 한번 이어볼까? == 성능 향상

색이 여러가지 때문에 한 객체가 하나가 아니라 여러 객체로 보인다.
컴퓨터는 이걸 어떻게 한 객체로 알아볼 수 있을까?
여러 장의 사진을 통해 주입시킨다.
필터 사이즈가 다양한 이유? - 필터 사이즈== 수용영역
객체마다 사이즈가 다르기 때문에 여러 사이즈의 필터를 통해 추출한다.

이미지 크기를 다시 키울 때 빈 곳 발생 -> 1. convolution 2. 보간

728x90