2024/06/03 6

자연어 처리 11강 - Named Entity Recognition (NER) + BERT

이 단어가 회사인지, 기관인지, 나라, 시설 등 다양한 개체, 대명사, 이름 중에 무엇인지 맞추는 작업이다. 위키에 페이지로 존재하는 명사로 생각하면 편하다.  이름이 너무 길거나, 모든 이름을 포함하지 않고(Zipf's Law), 동일한 이름을 가지는 경우 모델이 제대로 파악하지 못하는(Ambiguity) 경우가 생긴다.  규칙 기반 NER1. 높은 정밀도 rule을 통해 애매하지 않은 mentions를 라벨한다. - recall을 확보해야 한다.2. 감지된 entities의 label 전파3. list를 활용하여 더 식별4. 순차적 라벨링 더보기이 부분은 규칙 기반 Named Entity Recognition (NER)에 대한 설명입니다. NER은 텍스트에서 특정 명명된 엔티티(사람, 조직, 장소, ..

자연어 처리 10강 - Language Modeling with GPT

언어 모델은 다음 단어가 무엇이 나올지 맞춘다. 문맥을 보고 마스킹 된 단어 맞추기 단어 예측하기 기존 단어들이 input이 들어갔을 때 가장 높은 확률을 가지는 단어를 가지고 온다. 이전을 보고, 다음 단어를 구하는 것을 반복한다 == auto regressive n-gram 앞의 문맥을 버리고, n개의 단어까지만 확인해서 그 확률이 어떻게 되는지 확인한다.  RNN이전의 모든 input을 고려할 수 있다. 복잡도는 낮을 수록 좋다!RNN은 n-gram 모델보다 복잡도가 낮으므로 좋다! 이전의 언어 모델들은 각각 특징을 잡아서 다른일을 했는데 이제는 이 모든일을 하나의 모델이 다 할 수 있다. Open AI의 GPT는 많은 데이터로 pre-training (사전학습,언어적 체계를 이해, 대량의 북 코퍼..

생성형 인공지능 입문 - 14주차 퀴즈

다음 문장의 빈칸에 들어갈 가장 적절한 단어를 고르시오.“자율주행 자동차에서 행동생성은 차량 시스템이 미리 정의된 목표뿐만 아니라 환경에 대한 인지된 정보를 바탕으로 적절한 행동계획을 수립하기 위한 _____과 _______을 의미한다.”하나를 선택하세요.1.연산, 의사결정2.분석, 반응3.프로세스, 조정4.절차, 전략오... 연산과 의사결정 같네요문장의 빈칸에 들어갈 가장 적절한 단어는 "연산, 의사결정"입니다. 따라서 정답은 1번입니다.문장 완성:“자율주행 자동차에서 행동생성은 차량 시스템이 미리 정의된 목표뿐만 아니라 환경에 대한 인지된 정보를 바탕으로 적절한 행동계획을 수립하기 위한 연산과 의사결정을 의미한다.”선택지 분석:연산, 의사결정:연산은 데이터 처리 및 계산을 의미하고, 의사결정은 그 결..

인공지능/공부 2024.06.03

생성형 인공지능 입문 - 14주차 transformer 기반 행동 생성 2

이번 시간은 14주차 입니다.14주차 강의는 총 5개의 차시로 구성되어 있습니다.이번 강의에서는 자율주행 생성 모델, 자율주행 생성 모델 학습, 자율 자동차 행동 생성,행동 생성 트랜스 포머를 다룹니다.강의를 통해서 여러분은 자율주행 생성 모델, 자율주행 생성 모델 훈련 장점, 자율주행 행동 생성을 설명할 수 있고,AIGC(Artifical intelligence generated content), 행동 생성을 위한 트랜스포머의 응용 모델을 설명할 수 있게 됩니다.1차시 - 자율주행차 생성 모델레이더는 먼 거리를 확인할 수 있다. 주차할 때 거리감지는 ultrasonic을 사용한다.테슬라는 비전으로만 이동을 진행하고 있다. 길과 인식이 상호작용한다. Low Level - 인식High Level - way..

인공지능/공부 2024.06.03

모두를 위한 머신러닝 - 14주차 퀴즈

아래 문장에 있는 빈칸에 들어갈 가장 적당한 단어를 하나 고르시오.“이상 데이터 검출 모델은 (________)를 사용하여 데이터가 정상인지, 비정상인지 여부를 결정하며, 만약 데이터의 확률이 정해진 (________)보다 작으면 이상 데이터로 판정한다.”하나를 선택하세요.확률분포함수, 최소값확률분포함수, 임계값예측함수, 최소값예측함수, 임계값가우시안 분포! -> 확률 분포 함수, 입실론 == threshold == 임계값문장의 빈칸에 들어갈 가장 적절한 단어는 "확률분포함수, 임계값"입니다. 따라서 정답은 2번입니다.문장 완성:“이상 데이터 검출 모델은 (확률분포함수)를 사용하여 데이터가 정상인지, 비정상인지 여부를 결정하며, 만약 데이터의 확률이 정해진 (임계값)보다 작으면 이상 데이터로 판정한다.”..

인공지능/공부 2024.06.03

모두를 위한 머신러닝 - 14주차 이상 데이터 검출

Q. 다음 문장의 빈칸에 적절한 용어를 생각해 보세요."신용카드를 도난 당했지만, 도난 사실을 모르고 즉시 카드를 정지 시키지 못했거나, 신용카드 정보를 해킹 당했을 때 사용자는 매우 난처한 일을 겪을 수 있겠지요? 신용카드 회사에서는 사용자의 거래 내역 중에서 비정상적인 패턴을 찾아냄으로써 혹시 있을 지 모르는 신용카드 부정 사용을 막고자 노력합니다. 이처럼 많은 데이터 중에서 일반적으로 발생하지 않는 정상적이지 않은 데이터를 ( 이상 데이터(Anomaly) )라고 합니다."1차시 - 이상 데이터 검출 문제 정의  특징 - 열, 진동 강도 등 다양하게 볼 수 있다.이렇게 정상 범위에서 많이 벗어난 데이터를 이상 데이터라고 칭한다. 사용자의 행동 패턴을 특징 값으로 본다.저것으로 부족하면 인증키를 추가로..

인공지능/공부 2024.06.03
728x90
728x90