인공지능/공부

모두를 위한 머신러닝 중간고사

이게될까 2024. 4. 25. 17:06
728x90
728x90

1. 머신러닝 기법을 사용하는 것이 적합하다고 생각되는 컴퓨터 응용분야의 예시 2가지를 고르시오.
하나 이상을 선택하세요.

문단의 주제를 나타내는 토픽 문장 추출하기

데이터베이스 관리하기

계산기 프로그램 작성하기

신청자의 신용상태를 고려하여 융자를 승인할 것인지 결정하기

계산기와 같은 프로그램은 그냥 프로그램으로 만든게 훨씬 빠르고 간편하다. 데이터 베이스 관리도 머신러닝이 하기엔.....

머신러닝 기법을 사용하는 것이 적합한 컴퓨터 응용분야의 예시로는 다음 두 가지를 선택할 수 있습니다:

  1. 문단의 주제를 나타내는 토픽 문장 추출하기 - 이 경우, 머신러닝은 다양한 텍스트 데이터에서 중요한 주제나 개념을 식별하고, 그와 관련된 핵심 문장을 추출하는 데 사용될 수 있습니다. 자연어 처리(Natural Language Processing, NLP) 기술은 문맥적 이해와 텍스트 내 정보의 중요도를 평가하여 주제 문장을 추출하는 데 매우 효과적입니다.
  2. 신청자의 신용상태를 고려하여 융자를 승인할 것인지 결정하기 - 이 영역에서 머신러닝은 신청자의 신용 기록, 과거 거래, 소득 수준 등 다양한 변수를 분석하여 융자 승인 가능성을 평가합니다. 이러한 분석을 통해 금융 기관은 위험을 관리하고, 융자 승인 결정을 자동화하는데 도움을 받을 수 있습니다.

데이터베이스 관리와 계산기 프로그램 작성은 일반적으로 머신러닝 기법보다는 정형화된 알고리즘과 절차적 프로그래밍에 의존하는 작업입니다. 따라서 머신러닝을 적용하기보다는 다른 기술적 접근이 더 적합할 수 있습니다.

두뇌에 관한 다음 설명의 빈칸에 들어갈 가장 적절한 단어들을 고르시오.

2. "_____________을 통하여 새로운 지식을 습득할 수 있으며, 아주 복잡하고 대규모의 _____________ 문제들을 해결할 수 있다."
하나를 선택하세요.

학습, 선형

학습, 비선형

지식, 선형

지식, 비선형

학습을 통해서 비선형 문제를 해결할 수 있지!

두뇌에 관한 설명의 빈칸을 채우는데 가장 적절한 단어들은 "학습"과 "비선형"입니다. 따라서 올바른 선택은 "학습, 비선형"입니다.

빈칸을 채우는 이유는 다음과 같습니다:

  1. "학습을 통하여 새로운 지식을 습득할 수 있으며" - 이 부분에서 '학습'은 두뇌가 새로운 정보를 받아들이고, 이해하며, 기억하는 과정을 의미합니다. '지식'을 사용하는 것은 문맥상 적합하지 않으며, '학습'이 새로운 정보를 받아들이는 과정을 더 정확히 표현합니다.
  2. "아주 복잡하고 대규모의 비선형 문제들을 해결할 수 있다." - 두뇌는 선형적인 문제뿐만 아니라, 더 복잡하고 예측하기 어려운 비선형 문제들을 해결하는 능력을 가지고 있습니다. '선형'보다는 '비선형'이 두뇌의 문제 해결 능력을 더 넓고 정확하게 표현합니다.

3. Underfitting과 관련된 단어를 2개 고르시오.
하나 이상을 선택하세요.

Low variance

High variance

High bias

Low bias

언더 피팅은 bias가 크고, weight학습이 덜 된 상태!

Underfitting과 관련된 단어는 "High bias"와 "Low variance"입니다. Underfitting은 모델이 데이터의 복잡성을 충분히 포착하지 못하고, 학습 데이터에도 잘 맞지 않을 때 발생합니다. 이런 경우, 모델은 단순화되어 너무 강한 가정을 하기 때문에 높은 편향성(high bias)을 가지며, 데이터 내의 변동성을 제대로 표현하지 못해 낮은 분산성(low variance)을 보입니다.

4. Overfitting과 관련된 단어를 2개 고르시오.
하나 이상을 선택하세요.

Low variance

High variance

High bias

Low bias

오버피팅은 weight가 너무 커지고 bias의 영향이 작아진 경우지!

Overfitting과 관련된 단어는 "High variance"와 "Low bias"입니다. Overfitting은 모델이 학습 데이터에 너무 잘 맞추어져 있어, 새로운 데이터나 테스트 데이터에는 잘 작동하지 않을 때 발생합니다. 이 경우, 모델은 학습 데이터의 무작위 노이즈까지 학습하게 되므로 높은 분산성(high variance)을 가지며, 학습 데이터에 대한 오류는 매우 낮기 때문에 낮은 편향성(low bias)을 보입니다.

다음 설명의 빈 칸에 들어갈 가장 적절한 단어들을 고르시오.

5. “오차 역전파 학습 알고리즘은 forward pass와 backward propagation 두 단계로 수행된다. Forward pass 는 주어진 입력에 대한 네트워크의 (______)을(를) 계산하는 과정이며, backward propagation는 네트워크의 실제 출력과 원하는 출력 사이의 (_____)을(를) 이용하여 가중치를 업데이트한다.”
하나를 선택하세요.

가중치, 오차

가중치, 그래디언트

출력, 오차

출력, 그래디언트

이거 나왔던 문제인거 같은데 출력 계산이었던거 같은데.... 그리고 오차를 통해 grident를 구해서 업데이트한다.

오차 역전파 학습 알고리즘에 관한 설명에서 적절한 단어들은 "출력, 그래디언트"입니다. 따라서 올바른 선택은 "출력, 그래디언트"입니다.

설명은 다음과 같이 이해할 수 있습니다:

  1. Forward pass는 주어진 입력에 대해 네트워크의 '출력'을 계산하는 과정입니다. 이 단계에서 네트워크는 입력 데이터를 받아 각 층의 노드를 통과하며 최종 출력을 생성합니다.
  2. Backward propagation는 네트워크의 실제 출력과 원하는 출력 사이의 '그래디언트'를 이용하여 네트워크의 가중치를 업데이트하는 과정입니다. 이 단계에서는 손실 함수로부터 그래디언트를 계산하고, 이를 사용해 각 가중치를 조정함으로써 학습이 진행됩니다.

따라서, 이 문맥에서 '가중치'나 '오차'는 적합하지 않습니다.

6. 다음 중 일괄(batch) 업데이트와 비교되는 순차(sequential) 업데이트를 설명하고 있는 문장들을 모두 고르시오.
하나 이상을 선택하세요.

국소적 저장공간을 덜 사용한다.

학습데이터 세트의 모든 데이터에 대해 가중치를 한번 업데이트한다.

계산량이 많다

구현하기가 쉽다

SGD는 한개씩 사용하니까 저장공간도 덜 사용하고, 구현하기 쉽겠쥬

순차(sequential) 업데이트, 종종 온라인 또는 스토캐스틱 업데이트라고도 불리는 방법을 설명하는 문장은 다음과 같습니다:

  1. 국소적 저장공간을 덜 사용한다. - 순차 업데이트 방식에서는 한 번에 하나의 데이터 포인트나 작은 데이터 그룹(미니 배치)만 메모리에 로드하여 처리합니다. 이로 인해 일괄(batch) 업데이트 방식에 비해 덜 많은 저장공간을 사용합니다.

다음의 문장들은 순차 업데이트에 해당하지 않습니다:

  • 학습 데이터 세트의 모든 데이터에 대해 가중치를 한 번 업데이트한다. - 이 문장은 일괄 업데이트 방식을 설명하는 것으로, 여기서는 전체 데이터 세트를 기반으로 한 번에 가중치를 업데이트합니다.
  • 계산량이 많다 - 일반적으로 계산량이 많은 것은 일괄 업데이트의 특성이며, 순차 업데이트는 각 업데이트에서 계산량이 상대적으로 적습니다.
  • 구현하기가 쉽다 - 이는 순차 업데이트와 일괄 업데이트 양쪽에 적용될 수 있지만, 일반적으로 구현의 용이성은 특정 상황과 기술적 선택에 따라 다를 수 있으므로, 이 문장은 순차 업데이트만을 명확하게 설명하지 않습니다.

따라서 올바른 선택은 "국소적 저장공간을 덜 사용한다." 입니다.

728x90