반응형

2025/04 5

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios - 논문 리뷰

https://aclanthology.org/2024.findings-acl.259.pdf https://arxiv.org/abs/2401.17167 Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex ScenariosThe recent trend of using Large Language Models (LLMs) as tool agents in real-world applications underscores the necessity for comprehensive evaluations of their capabilities, particularly in complex sce..

ALFWorld, Plan Bench 뜯어보기

https://alfworld.github.io/ ALFWorldAligning Text and Embodied Environments for Interactive Learningalfworld.github.io https://github.com/alfworld/alfworld GitHub - alfworld/alfworld: ALFWorld: Aligning Text and Embodied Environments for Interactive LearningALFWorld: Aligning Text and Embodied Environments for Interactive Learning - alfworld/alfworldgithub.com여기서 다운받을 수 있습니다. alfred.pddl에서는 각 ta..

인공지능/Agent 2025.04.08

Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical Tasks - 논문 리뷰

https://arxiv.org/abs/2410.18387 Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical TasksSeveral medical Multimodal Large Languange Models (MLLMs) have been developed to address tasks involving visual images with textual instructions across various medical modalities, achieving impressive results. Most current medical generalist models are regarxiv.org 지금 존재하는 모델들은 Re..

오랜만에 파이썬 복습하기 - List, Tuple, Set, Dictionary, numpy

print("awegaewg",3,"awegawegaweg",654684,"\n\naegage")print에선 ,를 통해 여러가지 출력할 수 있다. List a = [1,2,3,[4,5,6],[7,8],9]print(a)이렇게 부분만 지정해줄 수 있습니다. -는 뒤에서부터 숫자를 세기에 2개가 빠지는 것을 볼 수 있습니다.List는 독립적이지 않습니다.그렇기에 .copy를 통해 독립적으로 만들어 줘야 함  생성할 때 곱하기 연산자도 사용 가능합니다. 이걸 통해 좀 더 다양하게 생성 가능!이렇게 되니 조심해야 합니다. 다양하게 응용해서 생성 가능합니다. append를 통해서 list에 값 추가 가능  저 곱하기 기호는 조심해서 사용하긴 해야 겠네요  count를 통해 list안에 몇개가 있는지 알 수 있습..

언어/Python 2025.04.04

vllm 활용해서 logit 추출 및 logprob, CoT, SC-CoT Inference 진행

class로 된 python이라 self나 다른 것 들이 붙어있긴 한데 적당히 보면 될 것 같습니다.기록 용이라....from datasets import load_from_disk, DatasetDictimport argparse, os, json, torch, itertools, math, refrom typing import List, Dict, Tuplefrom scipy.special import digammafrom vllm import LLM, SamplingParamsfrom collections import defaultdict, Counterfrom transformers import AutoTokenizerfrom setproctitle import setproctitle 일단 전부 ..

728x90
728x90