강좌 상세페이지 배경
-
Reinforcement Learning Ongoing Certificate
-
Reinforcement Learning
-
Field Engineering (Computers & Communication)
Operating Institute Operating Institute Sejong University Go to the operating agency Opens new window
Week Week 15 Week
Course Registration Period Course Registration Period 25.03.18 ~ 26.02.28
Phone Number Phone Number 02-3408-3854
Course Satisfaction 4.5
-
Difficulty Difficulty advanced
Certificate Certificate Issuance
Learning recognition time Learning recognition time 23Hour 34Minute (18Hour 16Minute)
Course Duration Course Duration 25.03.18 ~ 26.02.28
Subtitle language 한국어 Others 1ea Subtitle language
Course language 한국어(ko)
-
List of participating institutions
Course Introduction
Syllabus
주차 | 주차명(주제) | 차시 | 차시명(학습내용) | 평가방법 |
1 | 강화학습 소개 | 1-1 | 강화학습의 개요 | 퀴즈 |
1-2 | 강화학습의발전 과정 | |||
1-3 | 강화학습의 구성 요소 | |||
1-4 | 강화학습의 동작 방식 | |||
1-5 | 강화학습의 문제 해결 방법 | |||
2 | 다중 슬롯머신 문제 | 1-1 | 다중 슬롯머신 소개 | 퀴즈 |
1-2 | 탐욕적 알고리즘 | |||
1-3 | 점진적 구현 | |||
1-4 | 신뢰 상한 행동 선택 | |||
1-5 | 경사도 다중 슬롯머신 알고리즘 | |||
3 | 마르코프 결정 프로세스 (MDP) | 1-1 | MDP의 정의 | 퀴즈 |
1-2 | MDP의 구성 요소 | |||
1-3 | MDP의 목표 | |||
1-4 | 정책 평가와 개선 | |||
1-5 | MDP를 활용한 문제 해결 | |||
4 | 벨만 방정식 | 1-1 | 상태 가치 함수의 | 퀴즈 |
1-2 | 행동 가치 함수의 | |||
1-3 | 상태 가치 함수의 | |||
1-4 | 행동 가치 함수의 | |||
1-5 | 벨만 방정식의 적용 | |||
5 | 모델 기반 플래닝 | 1-1 | 동적 프로그래밍 소개 | 퀴즈 |
1-2 | 반복적 정책 평가 | |||
1-3 | 정책 최적화를 위한 정책 반복법 | |||
1-4 | 정책 최적화를 위한 가치 반복법 | |||
1-5 | 정책 반복법과 가치 반복법 비교 | |||
6 | 모델 프리 가치 평가 | 1-1 | 모델 프리 학습 개요 | 퀴즈 |
1-2 | MC(Monte Carlo) 기반 가치 평가 | |||
1-3 | TD(Temporal Difference) 기반 가치 평가 | |||
1-4 | MC와 TD 기법 비교 | |||
1-5 | TD 기법의 확장 | |||
7 | 모델 프리 정책 최적화 | 1-1 | MC 기반 정책 최적화 | 퀴즈, 과제 |
1-2 | SARSA 알고리즘 | |||
1-3 | Q-러닝 알고리즘 | |||
1-4 | SARSA와 Q-러닝 알고리즘 비교 | |||
1-5 | SARSA와 Q-러닝의 변형 | |||
8 | 중간고사 |
| 중간고사 응시 | 중간고사 |
9 | 강화학습을 위한 딥러닝 | 1-1 | 딥러닝 개요 | 퀴즈 |
1-2 | CNN(Convolutional Neural Network) | |||
1-3 | RNN(Recurrent Neural Network) | |||
1-4 | 신경망의 학습 | |||
1-5 | 강화학습에서 딥러닝의 역할 | |||
10 | 심층 강화학습 | 1-1 | 강화학습에서 피드백 유형 | 퀴즈 |
1-2 | 강화학습을 위한 함수 근사화 | |||
1-3 | Q-러닝의 신경망 구현 | |||
1-4 | 정책 경사법 소개 | |||
1-5 | 심층 강화학습 알고리즘 분류 | |||
11 | 가치 기반 심층 강화학습 | 1-1 | DQN(Deep Q Network) | 퀴즈 |
1-2 | Double DQN | |||
1-3 | Dueling DQN | |||
1-4 | 우선순위 경험 재현 | |||
1-5 | Rainbow | |||
12 | 정책 기반 심층 강화학습 | 1-1 | REINFORCE 알고리즘 | 퀴즈 |
1-2 | Actor-Critic 알고리즘 | |||
1-3 | DDPG(Deep Deterministic Policy Gradient) | |||
1-4 | SAC(Soft Actor-Critic) | |||
1-5 | TRPO(Trust Region Policy Optimization)와 PPO(Proximal Policy Optimization) | |||
13 | 강화학습과 알파고 | 1-1 | 알파고의 구조 | 퀴즈 |
1-2 | MCTS(Monte Carlo Tree Search) | |||
1-3 | 알파고의 학습 방법 | |||
1-4 | 알파고 제로 | |||
1-5 | 알파제로 | |||
14 | 메타 강화학습 | 1-1 | 메타러닝 소개 | 퀴즈 |
1-2 | 메타러닝 종류 | |||
1-3 | 순환 정책 메타 강화학습 | |||
1-4 | 최적화 기반 메타 강화학습 | |||
1-5 | 컨텍스트 기반 메타 강화학습 | |||
15 | 기말고사 |
| 기말고사 응시 | 기말고사 |
Course Operators
-
김정현 교수세종대학교 인공지능데이터사이언스학과 교수
前 한국전자통신연구원 연구원
前 삼성전자 삼성리서치 책임연구원
FAQ
Q 강좌 이수 기준이 어떻게 되나요?
A 이수 기준 총점 60점 이상입니다.
Q 평가 계획이 궁금합니다.
A △퀴즈(매주, 20%) △과제(1회, 20%) △중간고사(1회, 30%) △기말고사(1회, 30%)
Other / Inquiries
세종대학교 Sejong-MOOC센터 02-3408-3854
Field Engineering (Computers & Communication)
Difficulty Difficulty advanced
Operating Institute Sejong University Go to the operating agencyOpens new window
Certificate Certificate Issuance
Week Week 15 Week
Learning recognition time Learning recognition time 23Hour 34Minute (18Hour 16Minute)
Course Registration Period Course Registration Period 25.03.18 ~ 26.02.28
Course Duration Course Duration 25.03.18 ~ 26.02.28
Phone Number Phone Number 02-3408-3854
Subtitle language 한국어 Others 1ea Subtitle language
Course language 한국어(ko)
Recommended Courses
Same institution course
-
Memory Exploit: Hacking and Defense Ongoing CertificateMemory Exploit: Hacking and Defense
Jong-Hyuk Lee
Sejong University
2025.10.01 ~ 2026.02.26메모리 해킹 익스플로잇 스트링 버퍼_오버플로우-
Providers
Providers Sejong University
-
Week
Week 16Week
-
Learning time
Learning time (VOD time) 38Hour 30Minute (19Hour 54Minute)
-
Providers
-
Visual Programming End(Audience)Visual Programming
Lee Jong Weon
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 23Hour 22Minute (18Hour 23Minute)
-
Providers
-
Machine Learning for Everyone EndMachine Learning for Everyone
Kong and 1 others
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 24Hour 10Minute (15Hour 18Minute)
-
Providers
-
Multimedia End(Audience)Multimedia
Kim and 1 others
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 21Hour 33Minute (20Hour 43Minute)
-
Providers
-
Introduction to Generative AI EndIntroduction to Generative AI
Yong-Guk Kim
Sejong University
2025.09.01 ~ 2025.12.14AI 인공지능 생성형_인공지능 생성형_AI chatGPT Generative_AI-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 24Hour 30Minute (19Hour 18Minute)
-
Providers
-
Big Data and Artificial Intelligence Marketing(2) : Orange Practice EndBig Data and Artificial Intelligence Marketing(2) : Orange Practice
Jong-Pil Woo
Sejong University
2025.10.27 ~ 2025.12.14빅데이터 마케팅 인공지능 지도학습 비지도학습 오렌지_프로그램-
Providers
Providers Sejong University
-
Week
Week 7Week
-
Learning time
Learning time (VOD time) 11Hour 44Minute (08Hour 08Minute)
-
Providers
-
Big Data and Artificial Intelligence Marketing(1) : Concepts and Practices of Big Data and Artificial Intelligence EndBig Data and Artificial Intelligence Marketing(1) : Concepts and Practices of Big Data and Artificial Intelligence
Jong-Pil Woo
Sejong University
2025.09.01 ~ 2025.10.26빅데이터 인공지능 AI 4차_산업혁명 마케팅-
Providers
Providers Sejong University
-
Week
Week 8Week
-
Learning time
Learning time (VOD time) 13Hour 21Minute (09Hour 40Minute)
-
Providers
-
AI Contents Art Producing EndAI Contents Art Producing
Changwan Han
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 12Hour 48Minute (05Hour 46Minute)
-
Providers
-
Coding and storytelling EndCoding and storytelling
Sung Wook Baik
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 16Hour 08Minute (06Hour 59Minute)
-
Providers
-
Coding in Physics for Everyone EndCoding in Physics for Everyone
Oh-young Song
Sejong University
2025.09.01 ~ 2025.12.14-
Providers
Providers Sejong University
-
Week
Week 15Week
-
Learning time
Learning time (VOD time) 15Hour 54Minute (04Hour 59Minute)
-
Providers
