반응형

인공지능 665

matlab 강화학습 onramp 1 - 강화 학습 개요

시뮬링크를 활용한 선반 사이를 지나가는 로봇을 만든다.더보기에이전트를 훈련시켰으면 에이전트가 어떻게 동작하는지 확인할 수 있습니다. sim 함수를 사용하여 시뮬레이션을 실행할 수 있습니다. out = sim(agent,environment) MAT 파일 robotmodel.mat에는 변수 agent와 env가 포함되어 있으며, 이 두 변수는 각각 사전 훈련된 RL 에이전트와 모델 whrobot.slx를 사용하는 시뮬레이션 환경을 나타냅니다. 작업 sim 함수에서 RL 에이전트 agent를 제어기로 사용하여 env에 저장된 로봇 모델의 시뮬레이션을 실행하세요. 시뮬레이션 결과를 simout이라는 변수에 저장하세요. 출력 패널에서 코드 실행 중에 시뮬레이션이 어떻게 애니메이션되는지 살펴보세요.simout =..

matlab 강화학습 - 다중 에이전트 강화 학습

https://kr.mathworks.com/videos/an-introduction-to-multi-agent-reinforcement-learning-1657699091457.html An Introduction to Multi-Agent Reinforcement LearningLearn what multi-agent reinforcement learning is and some of the challenges it faces and overcomes.kr.mathworks.com아오 또 한글 번역이 없네요...https://kr.mathworks.com/help/reinforcement-learning/ug/train-3-agents-for-area-coverage.html Train Multipl..

딥러닝 강화학습을 통해 워킹 로봇 작동하기 matlab

https://kr.mathworks.com/videos/deep-reinforcement-learning-for-walking-robots--1551449152203.html Deep Reinforcement Learning for Walking RobotsUse MATLAB, Simulink, and Reinforcement Learning Toolbox to train control policies for humanoid robots using deep reinforcement learning.kr.mathworks.com이 강의 인데 자막이 없네요...영어 자막이라도 있으면 알아볼텐데 일단 열심히 해보겠습니다 ㅠㅠㅠㅠ2024.05.08 - [인공지능/강화학습] - matlab 강화학습 - walk..

matlab 강화학습 - 정책과 학습 Policies and training

https://kr.mathworks.com/videos/reinforcement-learning-part-3-policies-and-learning-algorithms-1554395009678.html Reinforcement Learning, Part 3: Policies and Learning AlgorithmsThis video provides an introduction to the algorithms that reside within the agent. We’ll cover why we use neural networks to represent functions and why you may have to set up two neural networks in a powerful family of..

matlab 강화 학습 - Reinforcement Learning(RL)

https://kr.mathworks.com/videos/reinforcement-learning-part-1-what-is-reinforcement-learning-1551974943006.html 강화 학습이란? | 강화 학습 Part 1엔지니어의 관점에서 강화학습에 대해 전반적으로 살펴볼 수 있습니다. 강화학습은 매우 까다로운 제어 문제를 해결할 잠재력을 지닌 일종의 머신러닝입니다.kr.mathworks.com일단 여기서 진행된 내용입니다.강화학습을 통해 어려운 제어 문제를 풀 수 있다! 전통적인 제어 방식에서 로봇을 걷게하기는 너무 힘든 일이다. 이미지 -> 특징 추출 -> 센서와 결합하여 상태 추청 -> 컨트롤 (다양한 제어 관계가 있다.) -> 보행특징 추출, 상태 추정과 컨트롤을 딥러닝(머신..

인공지능과 빅데이터 10주차 3차시 - 인공지능 윤리의 중요성과 원칙

그러나 이 것도 데이터에 의한 학습이 아닌가...?소수의 데이터는 수집도 어렵다 -> 학습에 문제가 생긴다.편의성과 안락함을 줄 순 있지만 인간에게 해를 끼칠 수 있다!이슈가 있다 == 보안한다.기술 수준의 개발만 하는 것이 아닌 도덕성 가치와 윤리를 같이 고려한다.개인정보 이출 이슈를 보호하겠다는 것이다.윤리 이슈를 개인정보 보호에 맞추고 있다.위배할 가능성이 매우 높은 것이다.결론!판사 AI를 만들었는데 지금까지의 모든 판결 데이터를 가지고 만들었어그런데 흑인의 범죄 비율이 압도적으로 높았고 범죄도 많이 일으킨다고 가정하면 그 AI판사가 흑인에 대해 실형 판결을 많이내는 것이 윤리적 문제는 아니지 않아?학습데이터도 잘 학습하고, 판결도 잘 한거잖아이 문제는 인공지능이 사회적, 윤리적 맥락에서 어떻게 ..

인공지능/공부 2024.05.07

인공지능과 빅데이터 10주차 2차시 - 인공지능 윤리이슈

인공지능이 발달하면 보안을 뚫어서라도 핵을 쏠 수 있다.또한 무기 시스템 개발에 이용하여 대량 살상 무기로 활용될 수 있다.전쟁에는 인공지능을 활용하지 않겠다는 구글의 지침특정 인물, 성별, 인종을 공격할 수 있게 된다.취향을 예측하여 동영상을 추천해준다.삶을 개선하는데 사용하므로 필요하다!워치도 심박수, 생활 패턴을 파악하여 운동을 추천하기도 한다.위험성 방지를 위해 인공지능 윤리를 고려해야 한다.특정 분야에서는 사람 이상의 성능을 내기 때문에 이슈가 되고 있다.연인 간의 대학교 100억개를 학습했다.출시 이후 사용자와의 대화를 학습하여 동성애, 장애인 등 혐오 발언을 학습하여 비윤리적인 언어를 사용하게 되어 서비스를 중단하게 되었다.자율주행 차가 사고를 내면 누구 책임인가?여기서 인공지능의 윤리 문제..

인공지능/공부 2024.05.07
728x90
728x90