강좌소개
본 강좌는 로봇 시뮬레이션 환경에서 수집되는 센서 및 행동 데이터를 기반으로, 강화학습의 기본 개념과 작동 원리를 학습하고, 시각 및 음성 정보를 활용해 로봇이 상황을 인식하고 지능적인 행동을 선택하는 전체 구조를 이해한다.더불어 다양한 강화학습 알고리즘(DQN, PPO 등)을 비교 분석하고, 상태-행동-보상 구조 설계, 학습 성과 해석, 시각·음성 기반 입력의 융합을 통해 실제 환경에 적용 가능한 행동 정책을 구성하는 역량을 갖추는 것을 목표로 한다.