반응형

인공지능 649

자연어 처리 기계 번역 - 규칙, 통계 기반 기계 번역

목표 - 전통적인 통계 기반 기계 번역의 작동 원리와 한계점에 대해 이해!규칙에 따라 단어 수준으로 번역한다.각각을 고려하든 전체를 고려하든 이런 규칙을 기반으로 단어를 출력했다.점점 추상화 시키면서 변환한다. 인코더, 디코더 구조와 같아지는 느낌이네요attention이 없었기 때문에 단어 간 의미 상관관계는 거의 없겠죠규칙이 굉장히 많으면 단어 수준에서 좋을 수 있다.예제 기반 ( 코퍼스 기반) 단어 사전을 구축한다.뉴스는 정형화 되어 있다. -> 단어의 빈도가 비슷하다.sns -> 노이즈가 엄청 심해서 구축이 잘 되지 않는다. -> DKvec통계량 기반이기 때문에 빈도가 달라버리면 엉망으로 만들어질 가능성이 높다. -> 품질 좋은 단어 사전 만들기 어렵다.예외 처리에 취약하다.원본언어 -> 추상화 -..

자연어 처리 기계 번역 - 병렬 학습 데이터셋 수집

임베딩 과정에 대해 다시 한번...Transformer 모델에서 문장을 처리하는 과정은 다음과 같은 여러 단계를 포함합니다:1. 토큰화(Tokenization)먼저, 입력되는 문장을 작은 단위로 분해해야 합니다. 이 작은 단위를 토큰이라고 하며, 토큰은 단어나 서브워드(subword) 단위일 수 있습니다. 서브워드 토큰화는 일반적으로 Byte Pair Encoding (BPE)나 SentencePiece와 같은 알고리즘을 사용하여 수행되며, 이는 자주 사용되는 문자열을 하나의 토큰으로 결합합니다. 이러한 접근 방식은 언어의 유연성을 높이고 OOV 문제를 줄이는 데 도움을 줍니다.2. 임베딩(Embedding)토큰화된 각 토큰은 임베딩 과정을 거쳐 고정된 크기의 벡터로 변환됩니다. 이 벡터는 해당 토큰의 ..

자연어 처리 기계 번역 - 기계 번역이란?

목표 - 대표적인 자연어 처리 task인 기계번역 작업의 목표를 이해하자!seq2seq나 transformer도 기계번역을 반전하기 위해 나온 것!전문적인 번역가한테 기계번역이 좋은 프로토 타입이 되어 생산성 향상에 도움이 될 수 있다.통계 기반 - TF, TF-IDF 등등...컴퓨터가 언어를 분석해서 알아서 이해해야 한다!통계 기반이기 때문에 규칙 기반보다는 더 나은 방식이었다.통계량을 뽑아내기 힘들다 -> 성능이 떨어진다......딥러닝 기반의 기계 번역 시스템에서 학습하지 않은 단어, 즉 "out-of-vocabulary" (OOV) 단어에 대한 처리는 중요한 문제 중 하나입니다. FastText와 같은 도구를 사용하여 단어의 부분적인 정보를 학습하는 것 외에도, 몇 가지 다른 접근 방법이 있습니다..

모두를 위한 머신러닝 중간고사

1. 머신러닝 기법을 사용하는 것이 적합하다고 생각되는 컴퓨터 응용분야의 예시 2가지를 고르시오.하나 이상을 선택하세요.문단의 주제를 나타내는 토픽 문장 추출하기데이터베이스 관리하기계산기 프로그램 작성하기신청자의 신용상태를 고려하여 융자를 승인할 것인지 결정하기계산기와 같은 프로그램은 그냥 프로그램으로 만든게 훨씬 빠르고 간편하다. 데이터 베이스 관리도 머신러닝이 하기엔.....머신러닝 기법을 사용하는 것이 적합한 컴퓨터 응용분야의 예시로는 다음 두 가지를 선택할 수 있습니다:문단의 주제를 나타내는 토픽 문장 추출하기 - 이 경우, 머신러닝은 다양한 텍스트 데이터에서 중요한 주제나 개념을 식별하고, 그와 관련된 핵심 문장을 추출하는 데 사용될 수 있습니다. 자연어 처리(Natural Language Pr..

인공지능/공부 2024.04.25

딥러닝 개론 중간고사

기억이 나는 것만 작성..OX 문제 - 10문제batch normalization은 활성화 함수 전에 해도 되고, 지나고 해도 된다.- O오버 피팅을 해결하기 위해서는 히든 레이어를 추가하고, 노드를 늘린다 - X점별 Convolution을 사용하면 activation map의 사이즈가 그대로이다. - 사이즈에서 채널을 포함 시켜야 할지 아닐지 고민하다가 사이즈는 포함 안될거 같아서 O...그룹 Convolution에선 GPU를 따로 할당해야한다. - AlexNet이 GPU 각각 할당이 필요하지 그룹 콘볼루션이 무조건 GPU따로 할당은 아닐꺼라 생각해서 X... backpropagation 손 계산인데 그냥 개념만 알면 풀 수 있도록 나왔음 인풋 주어주고, parameter랑 bias 맞추기  activ..

인공지능/공부 2024.04.25

딥러닝개론 중간고사 예측

이번엔 역순으로 Convolution부터 진행하겠씁니다... 첫 단원부터 보려니까 너무 지겨웟Convolution만해도 나올게 너무 많아보이는데....max 위치만 살려서 보내고 아니었던 곳에는 0을 보냅니다. 그럼 그쪽은 다 업데이트가 안되겠지만 뭐 결과에 영향도 못 줬으니까요,...이 그림은 컨볼루션 신경망에서의 역전파(backpropagation) 단계를 시각화한 것입니다. 컨볼루션 신경망의 학습 과정에서 가중치(weights)를 업데이트하기 위해, 그라디언트(오차 신호)를 사용하는 방법을 보여주고 있습니다. 각 단계를 상세하게 설명해보겠습니다.순전파 (Forward Pass)컨볼루션 레이어: 입력 (a)에 컨볼루션 커널(필터)를 적용하여 활성화 맵(Activation map)을 생..

인공지능/공부 2024.04.24

생성형 인공지능 입문 중간고사

언어 모델을 생성할 때 필요한 기본 단계 중 하나가 아닌 것은 무엇입니까?하나를 선택하세요.a. 데이터셋 선택b. 입력 텍스트 사전 처리c. 모델 평가d. 인터페이스 디자인인터페이스는..... 일단 언어모델 다 만들고 합시다.언어 모델을 생성할 때 기본적으로 필요한 단계에는 데이터셋 선택, 입력 텍스트의 사전 처리, 그리고 모델 평가가 포함됩니다. 이 세 가지 단계는 모델이 언어를 어떻게 이해하고 생성할지를 결정하는 데 중요한 역할을 합니다.a. 데이터셋 선택: 모델이 학습할 데이터를 결정합니다. 이 단계에서는 대량의 텍스트 데이터를 수집하고, 해당 데이터가 모델의 용도에 적합한지 평가합니다.b. 입력 텍스트 사전 처리: 텍스트를 모델이 처리할 수 있는 형태로 변환합니다. 이 과정에는 ..

인공지능/공부 2024.04.24

딥러닝 개론 중간고사 대비 문제 - backpropagation, convolution, optimization

PDF 파일을 기반으로 다양한 유형의 딥러닝 문제를 만들어보겠습니다. 이는 해당 주제에 대한 이해를 평가하고 학습을 돕기 위한 것입니다.1. OX 문제문제: 딥러닝은 머신러닝과는 다르게 항상 인간의 개입 없이 데이터의 특징을 스스로 학습할 수 있다. (O/X)정답: X해설: 딥러닝은 인간의 뇌를 모방한 신경망 구조를 사용하여 복잡한 데이터의 패턴을 학습하지만, 특정 애플리케이션에서는 인간의 개입이 필요할 수 있습니다. 예를 들어, 레이블링 작업이나 데이터 전처리 과정에서는 인간의 도움이 필요할 수 있습니다.2. 서술형 문제문제: 머신러닝과 딥러닝의 주요 차이점 두 가지를 설명하시오.정답:구조적 차이: 머신러닝은 간단한 데이터 패턴 인식에 종종 사용되는 반면, 딥러닝은 인간의 뇌를 모방한 ..

인공지능/공부 2024.04.24

강화학습 중간고사

위치가 11일 때, 상태 가치를 정책에 따라 구하고, 두 가치의 차를 구하라.감쇠인자는 0이다.감쇠인자가 0이면 당장 받는 보상의 기대값만 신경쓰면 되니까 둘다 -1이고, 차는 0 아닌가...? 아래 그림을 보고 q(s,a1)를 구하라 감쇠인자를 안알려주길래 감쇠인자 그대로 적었다가 1로 하라고 해서 이대로 계산했습니다. v*구하기2입니당 마르코프 상태에 대한 빈칸 문제 마르코프가 빈칸이었습니다. 그리고 모든 상황이 마르코프 상황인 것은 아니지만 모델링은 가능하다가 O,X문제로 나왔었습니다. O 마르코프 프로세스는 상태 집합, 보상함수, 감쇠인자로 이루어져 있다. XP가 빠졌습니다. 빈칸 문제 : 일정 시점부터 에피소드가 끝날 때 까지의 받은 보상의 합은 ( 리턴..

인공지능/공부 2024.04.24

강화학습 - TD에서 s'을 언제 업데이트 해야 할까?

MC에서 에피소드가 끝나야만 업데이트 하는 조건 때문에 끝이 없구나 너무 긴 에피소드에 대해서는 대안이 필요했다. TD는 '추측을 추측으로 업데이트하자'로 나온 종료하지 않은 MDP에서 학습 가능한 방법이다. TD에서는 s'으로 s에서 액션을 진행하여 상태가 변화하였다. 그런데 a을 취한다 해도 전이확률(P)가 있기 때문에 항상 일정한 위치로 이동하는 것이 아니다. 그래서 v(s')은 어떻게 놔야 되나 고민이 되었다. 업데이트 시점이 s'에 도착한 시점에서 v(s)를 업데이트 하는 것이다...... 나름 단순하게 해결..... 아래는 GPT와 대화를 통해 궁금증을 해결해봤는데 요즘 확실히 똑똑해졌다. 시간차(Temporal Difference, TD) 학습에서 상태 가치 함수 ( V(s) )를 업데이트하..

인공지능/공부 2024.04.23
728x90
728x90