반응형

인공지능/논문 리뷰 or 진행 172

Data-driven Energy Management Strategy for Plug-in Hybrid Electric Vehicles with Real-World Trip Information - 리뷰

간단하게는 차량의 효율적 운행을 위해 클라우드에서 파라미터를 보내주면 차량은 그 파라미터에 맞게 운행 방식을 변경하는 것이네요EMS(Energy management system)은 플러그인 하이브리드 자동차에서 전기와 연료를 어떻게 배분하여 사용할 지 결정하는 시스탬이다. 실시간으로 에너지를 관리하고 배분한다.CD-CS전략 - SOC(배터리 충전이 필요한 상태)가 최소 한계에 도달할 때 까지 전기 모드(CD)로 운행SOC는 한계를 유지하며 연료를 사용하여 운행하는 CS단계가 있다.이 방식은 최적 방식이 아니다.SDP(확률 동적 프로그래밍)을 통해 확인하자! -> 계산 리소스는 많이 필요하나 오프라인에서 이용할 수 있다.BUT 새로운 데이터에 대해선 다시 학습해야 한다. SMPC(확률 모델 예측 제어)은 ..

준비 중 - Evaluating the World Model Implicit in a Generative Model - 리뷰

더보기요약이 논문은 대형 언어 모델(LLM)이 학습된 도메인에 대해 암묵적으로 고품질의 '세계 모델'을 학습하는지 평가하는 방법을 탐구합니다. 구체적으로, 이 연구는 언어 모델이 주어진 시퀀스 데이터로부터 세계 모델을 회복하는 능력을 평가하기 위해 새로운 평가 지표를 제안합니다. 제안된 평가 지표는 언어 이론의 고전적인 Myhill-Nerode 정리를 기반으로 합니다. 이를 통해 게임 플레이, 논리 퍼즐, 지리적 내비게이션 등 다양한 도메인에서 모델의 세계 모델 회복 능력을 테스트합니다.중요한 점세계 모델 회복: LLM이 학습된 시퀀스 데이터에서 내재된 세계 모델을 회복할 수 있는지 평가하는 새로운 방법론을 제안합니다. 이는 언어 모델이 단순히 다음 토큰을 예측하는 능력을 넘어서는 잠재력을 갖고 있는지 ..

준비 중 - Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet - 리뷰

https://transformer-circuits.pub/2024/scaling-monosemanticity/index.html Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 SonnetAuthors Adly Templeton*, Tom Conerly*, Jonathan Marcus, Jack Lindsey, Trenton Bricken, Brian Chen, Adam Pearce, Craig Citro, Emmanuel Ameisen, Andy Jones, Hoagy Cunningham, Nicholas L Turner, Callum McDougall, Monte MacDiarmid, Alex Tamkin, Esin ..

진행중 - Slice and Conquer: A Planar-to-3D Framework for Efficient Interactive Segmentation of Volumetric Images - 리뷰

여긴 코드가 안보이네요https://ieeexplore.ieee.org/document/10483658 Slice and Conquer: A Planar-to-3D Framework for Efficient Interactive Segmentation of Volumetric ImagesInteractive segmentation methods have been investigated to address the potential need for additional refinement in automatic segmentation via human-in-the-loop techniques. For accurate segmentation of 3D images, we propose Slice-and-Conq..

feature 조절을 통한 LLM 변경 - Mapping the Mind of a Large Language Model - 리뷰

https://www.anthropic.com/news/mapping-mind-language-model Mapping the Mind of a Large Language ModelWe have identified how millions of concepts are represented inside Claude Sonnet, one of our deployed large language models. This is the first ever detailed look inside a modern, production-grade large language model.www.anthropic.com  더보기1. 서론 (Introduction)목적: 이 브리핑의 목적은 AI 모델, 특히 대형 언어 모델(LLMs..

준비중 - Counterfactual Mix-Up for Visual Question Answering - 리뷰 - 준비중

https://ieeexplore.ieee.org/document/10214215 Counterfactual Mix-Up for Visual Question AnsweringCounterfactuals have been shown to be a powerful method in Visual Question Answering in the alleviation of Visual Question Answering’s unimodal bias. However, existing counterfactual methods tend to generate samples that are not diverse or require auxiliieeexplore.ieee.org음 일단 이건 코드가 안보이네요더보기최근 인공지능 ..

진행 예정 - COFFEE: Boost Your Code LLMs by Fixing Bugs with Feedback - 리뷰 및 진행해보기 - 진행 예정

https://arxiv.org/abs/2311.07215 Coffee: Boost Your Code LLMs by Fixing Bugs with FeedbackCode editing is an essential step towards reliable program synthesis to automatically correct critical errors generated from code LLMs. Recent studies have demonstrated that closed-source LLMs (i.e., ChatGPT and GPT-4) are capable of generating correctivearxiv.orghttps://huggingface.co/collections/DLI-Lab/c..

Ever-Evolving Memory by Blending and Refining the Past - 리뷰 및 진행해보기 - 아직 코드 X

https://arxiv.org/abs/2403.04787 Ever-Evolving Memory by Blending and Refining the PastFor a human-like chatbot, constructing a long-term memory is crucial. However, current large language models often lack this capability, leading to instances of missing important user information or redundantly asking for the same information, thereby dimiarxiv.org https://linnk.ai/insight/%EC%9D%B8%EA%B3%B5%E..

Tuning Large Multimodal Models for Videos using Reinforcement Learningfrom AI Feedback 리뷰 및 진행해보기 - 코드 X

https://arxiv.org/abs/2402.03746 Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI FeedbackRecent advancements in large language models have influenced the development of video large multimodal models (VLMMs). The previous approaches for VLMMs involved Supervised Fine-Tuning (SFT) with instruction-tuned datasets, integrating LLM with visual encoarxiv.orghttps://githu..

CAT-Seg🐱: Cost Aggregation forOpen-Vocabulary Semantic Segmentation 리뷰 및 진행해보기 - 진행 중

https://ku-cvlab.github.io/CAT-Seg/ CAT-Seg🐱: Cost Aggregation for Open-Vocabulary Semantic Segmentation ku-cvlab.github.io  더보기요약오픈 보캐뷸러리 의미 분할(Open-Vocabulary Semantic Segmentation)은 이미지 내 각 픽셀을 텍스트 설명에 기반한 클래스 레이블로 지정하는 문제입니다. 이 논문은 CLIP 모델을 기반으로 이미지와 텍스트 임베딩 간의 코사인 유사도 점수(비용 볼륨)를 집계하는 새로운 방법을 제안합니다. 이 방법은 기존 모델들이 보지 못한 클래스에 대한 처리 문제를 해결하며, CLIP의 인코더를 미세 조정하여 세분화 작업에 적응시킵니다.주요 내용오픈 보캐뷸러리 의미 ..

728x90
728x90