반응형

2024/07/08 3

빅데이터 분석 실무 1일 차

R을 사용한다!데이터 사이언스 빅데이터 - 테라바이트 ~ 페타바이트에 이르는 크기로 용량이 크다.빅 데이터의 특징 3V/4VVolme - 대규모 데이터Velocity - 실시간에 가까운 빠른 수집 속도 Variety - 다양한 데이터 타입으로 정형, 비정형(영상, 소리, 이미지), 반정형Value - 빅 데이터를 활용한 가치 창출 의미 부여  = 새로운 가치 창조 3V를 통해 새로운 인사이트 Value를 창출한다.설명 모델 - 대규모 데이터를 분석하고 실제 문제 해결에 적용하는 학문예측 모델 - 설명모델 - Clusterind : 군집 분석, Decision Tree: 의사 결정 나무, 선형 회귀(Linear Regression)ex) 쇼핑물 모델에 따른 이탈 현상 예측모델 -  빅데이터 처리 과정데이터..

언어/R 2024.07.08

준비중 : Text Is All You Need: Learning Language Representations for Sequential Recommendation - 리뷰

[https://arxiv.org/abs/2305.13731]    논문 요약문제 정의순차 추천 시스템은 사용자의 역사적 상호작용을 시간 순서대로 모델링하여 사용자가 관심을 가질만한 아이템을 추천하는 것을 목표로 합니다. 기존의 방법들은 명시적인 아이템 ID나 일반적인 텍스트 특징을 사용하여 시퀀스를 모델링하지만, 차가운 시작(cold-start) 아이템을 모델링하거나 새로운 데이터셋으로 지식을 전이하는 데 어려움을 겪습니다.해결하려는 문제기존의 추천 시스템은 새로운 아이템(차가운 시작 아이템)이나 새로운 데이터셋에 적응하는 데 어려움을 겪습니다. 이러한 문제는 아이템을 고유 ID로만 인식하여 모델이 학습된 지식을 새로운 상황에 적용하기 어렵게 만듭니다.제안하는 방법논문에서는 사용자 선호도와 아이템 특징..

알고리즘 코드 챌린지 1일차 - 시간 복잡도

시간 복잡도 - 문제를 해결하는 데 걸리는 시간과 입력 사이의 관계빅 오 - 상한 접근 = 최악 경우빅 오메가 - 하한 접근 = 최선의 경우빅 세타 - 둘의 평균빅 오 표기법 종류1 - 일정한 복잡도 = 입력의 크기와 상관 없이 즉시 출력값을 얻어낼 수 있다.log N - N이 커질 수록 N보다 1의 복잡도에 가까워진다. = 중간값을 제시하면서 경우의 수를 절반 씩 나누는 법N - 선형 복잡도 = 입력과 실행시간이 같은 비율로 증가 (입력 값이 커질수록 계수의 의미가 퇴색)N log N -N^2 - 2차 복잡도 = 2중 for문에서 보인다.2^N - 지수 복잡도 = 특별한 경우를 제외하고는 안나오므로 다른 접근 방식을 고민해보는 것이 좋다.N! - 시간 복잡도가 가장 크다.시간 복잡도에 따라 실행 시간이..

알고리즘/공부 2024.07.08
728x90
728x90