참여기관 목록
강좌소개
■ 학습 목표: 인공지능 기계학습 분야 중 하나인 강화학습의 수학적 기초와 알고리듬에 대한 이해
■ 수업 내용: 본 강의는 인공지능의 주요분야 중 하나인 강화학습(reinforcement learning) 방법론의 기본 수학적 개념과 원리를 다루고 있습니다. 강화학습의 최신이론을 설명하는 것 대신, 강화학습을 구성하는 기본적인 원리의 이해를 돕기 위해 강화학습의 수학적인 근간이 되는 '동적계획법', '마르코브 과정', '마르코브 의사결정 프로세스' 등에 대해 그 개념을 예시와 함께 설명하고, 이를 바탕으로 강화학습 방법론들에 대해 보다 쉽게, 깊은 이해를 할 수 있도록 도움을 주는 강의입니다.
■ 추천 학습 대상 체크리스트
1. 인공지능에 관심이 있다.
2. 강화학습의 원리를 이해하고 싶다.
3. 인공지능 분야의 기초지식을 쌓고 싶다.
4. 강화학습의 주요 원리인 동적계획법, 마르코프 체인, 몬테카를로 알고리듬 등을 체계적으로 이해하고 싶다.
한 가지라도 해당된다면 이 강좌를 추천합니다!
| 주차 | 주제 | 강의명 |
|---|---|---|
| 1주차 | 강화학습의 이해 | 1.1 강화학습 개요 |
| 1.2 Multi-armed Bandit 문제 | ||
| 1.3 강화학습 맛보기 | ||
| 2주차 | 동적계획법 - 1 | 2.1 문제해결전략과 동적 계획법 |
| 2.2 동적 계획법의 주요개념(1) 최적화의 원리 | ||
| 2.3 동적 계획법의 주요개념(2) 중첩되는 부분문제와 역진귀납법 | ||
| 3주차 | 동적계획법 - 2 | 3.1 최단거리 문제 (Shortest Path) |
| 3.2 방문판매원 문제(Traveling Salesman Problem, TSP) | ||
| 3.3 배낭문제 (Knapsack Problem) | ||
| 4주차 | 마르코브 과정 | 4.1 마르코브 프로세스 개요 |
| 4.2 마르코브 프로세스 예시 | ||
| 4.3 마르코브 보상 프로세스 | ||
| 5주차 | 마르코브 결정 프로세스 - 1 | 5.1 MDP 개요 |
| 5.2 MDP 예시 - Examples of Markov Decision Process | ||
| 6주차 | 마르코브 결정 프로세스 - 2 | 6.1 MDP 가치함수 |
| 6.2 Infinite-horizon MDP | ||
| 7주차 | 마르코브 결정 프로세스 - 3 | 7.1 Value Iteration |
| 7.2 Policy Iteration | ||
| 8주차 | 중간고사 | 중간고사 |
| 9주차 | 강화학습 알고리듬 - 1 | 9.1 강화학습 Model-Free Reinforcement Learning |
| 9.2 몬테칼로 학습 Monte-Carlo Learning | ||
| 10주차 | 강화학습 알고리듬 - 2 | 10.1 시간차 학습 Temporal-Difference (TD) Learning |
| 10.2 SARSA 알고리듬 | ||
| 11주차 | 강화학습 알고리듬 - 3 | 11.1 On-policy vs. Off-policy |
| 11.2 Q-Learning 알고리듬 | ||
| 12주차 | 딥 강화학습 - 1 | 12.1 인공신경망 개요 |
| 12.2 Deep Q-Network (DQN) 개요 | ||
| 13주차 | 딥 강화학습 - 2 | 13.1 정책경사 (Policy Gradient) 개요 |
| 13.2 정책경사 정리 (Policy Gradient Theorem) 리뷰 | ||
| 14주차 | 딥 강화학습 - 3 | 14.1 REINFORCE 알고리듬 |
| 14.2 Actor-Critic 알고리듬 | ||
| 15주차 | 딥 강화학습 - 4 + 강의 정리 + 전문가 사례소개 (1) | 15.1 A3C 알고리듬 |
| 15.2 강의 정리 및 요약 | ||
| 15.3 학계 전문가 강연 | ||
| 16주차 | 전문가 사례소개 (2) | 16.1 산업계 전문가 강연 |
| 17주차 | 기말고사 | 기말고사 |
교수소개
- 정태수
- 고려대학교 산업경영공학부 부교수
- 고려대학교 공학대학원 스마트제조학과 주임교수
- 前)싱가포르 국립대학, 산업시스템공학과 조교수
- 前)Norfolk Southern Corp., Operations Research Analyst
- 前)한국전자통신연구원, 연구원
- E-mail: tcheong@korea.ac.kr
TA/운영진
- 강성호
- 고려대학교 일반대학원 산업경영공학과 박사수료
- E-mail: ght2game@korea.ac.kr
참고교재
- R.S. Sutton and A.G. Barto (2018)
『Reinforcement Learning: An Introduction』 MIT Press, Cambridge, MA
- M.L. Puterman (2005)
『Markov Decision Processes: Discrete Stochastic Dynamic Programming』
Wiley-Interscience
추천강좌
-
클라우드 진로설계 진행중 이수증클라우드 진로설계
강원대학교
2025.09.01 ~ 2025.12.30-
운영기관
운영기관 강원대학교
-
주차
주차 15 주
-
학습인정시간
학습인정시간 (총 동영상시간) 3시간 45분 (07시간 25분)
-
운영기관
-
컴퓨터 네트워크 진행중 이수증컴퓨터 네트워크
장한승 외 2 명
전남대학교
2025.11.03 ~ 2026.01.23차세대통신 컴퓨터 네트워크 7계층모델-
운영기관
운영기관 전남대학교
-
주차
주차 15 주
-
학습인정시간
학습인정시간 (총 동영상시간) 30시간 00분 (15시간 29분)
-
운영기관
-
RAG를 이용한 나만의 AI 금융 비서, 보험 설계사 만들기 진행중 이수증RAG를 이용한 나만의 AI 금융 비서, 보험 설계사 만들기
김종락
서강대학교(AID)
2025.11.17 ~ 2026.01.31-
운영기관
운영기관 서강대학교(AID)
-
주차
주차 7 주
-
학습인정시간
학습인정시간 (총 동영상시간) 17시간 00분 (05시간 29분)
-
운영기관
-
보험 및 금융 분야에 생성형 AI 활용법 진행중 이수증보험 및 금융 분야에 생성형 AI 활용법
임경수
서강대학교(AID)
2025.11.17 ~ 2026.01.31-
운영기관
운영기관 서강대학교(AID)
-
주차
주차 7 주
-
학습인정시간
학습인정시간 (총 동영상시간) 12시간 00분 (06시간 18분)
-
운영기관
-
머신러닝과 딥러닝 이론 및 Colab 실습 진행중 이수증머신러닝과 딥러닝 이론 및 Colab 실습
김종락
서강대학교(AID)
2025.11.17 ~ 2026.01.31-
운영기관
운영기관 서강대학교(AID)
-
주차
주차 7 주
-
학습인정시간
학습인정시간 (총 동영상시간) 21시간 00분 (05시간 46분)
-
운영기관
-
AWS 활용 클라우드 네트워크 보안 진행중 이수증AWS 활용 클라우드 네트워크 보안
김지연
대구대학교
2025.12.01 ~ 2026.01.09-
운영기관
운영기관 대구대학교
-
주차
주차 6 주
-
학습인정시간
학습인정시간 (총 동영상시간) 18시간 32분 (08시간 24분)
-
운영기관
-
AI기반 빅데이터 분석을 통한 지역 재생 정보 활용 진행중AI기반 빅데이터 분석을 통한 지역 재생 정보 활용
윤종희
영남대학교
2025.12.01 ~ 2026.01.31지역재생 빅데이터 Ai-
운영기관
운영기관 영남대학교
-
주차
주차 15 주
-
학습인정시간
학습인정시간 (총 동영상시간) 21시간 00분 (17시간 23분)
-
운영기관
-
[QGIS로 끝내는 공간정보 실무] 위성영상, 처리부터 AI 분석까지 진행중 이수증[QGIS로 끝내는 공간정보 실무] 위성영상, 처리부터 AI 분석까지
서동조
서울디지털대학교
2025.11.20 ~ 2028.02.28위성영상 QGIS 지구관측위성 인공위성 공간 공간정보-
운영기관
운영기관 서울디지털대학교
-
주차
주차 14 주
-
학습인정시간
학습인정시간 (총 동영상시간) 32시간 12분 (14시간 26분)
-
운영기관
-
사물인터넷 구현 및 응용 진행중사물인터넷 구현 및 응용
유인태
경희대학교
2025.10.15 ~ 2025.12.31-
운영기관
운영기관 경희대학교
-
주차
주차 7 주
-
학습인정시간
학습인정시간 (총 동영상시간) 4시간 10분 (07시간 01분)
-
운영기관
-
인공지능을 위한 기계학습 입문 진행중 이수증인공지능을 위한 기계학습 입문
이원희
경희대학교
2025.10.15 ~ 2025.12.31-
운영기관
운영기관 경희대학교
-
주차
주차 8 주
-
학습인정시간
학습인정시간 (총 동영상시간) 8시간 00분 (08시간 28분)
-
운영기관
같은기관강좌
-
데이터 분석 기초 진행중 이수증데이터 분석 기초
송상헌
고려대학교
2025.09.09 ~ 2025.12.31-
운영기관
운영기관 고려대학교
-
주차
주차 10주
-
학습인정시간
학습인정시간 (총 동영상시간) 18시간 00분 (09시간 38분)
-
운영기관
-
역사 데이터 분석 실습 진행중 이수증역사 데이터 분석 실습
김근하
고려대학교
2025.09.09 ~ 2025.12.31-
운영기관
운영기관 고려대학교
-
주차
주차 4주
-
학습인정시간
학습인정시간 (총 동영상시간) 6시간 00분 (04시간 02분)
-
운영기관
-
문학 데이터 분석 실습 진행중 이수증문학 데이터 분석 실습
이승은
고려대학교
2025.09.09 ~ 2025.12.31-
운영기관
운영기관 고려대학교
-
주차
주차 4주
-
학습인정시간
학습인정시간 (총 동영상시간) 6시간 00분 (04시간 03분)
-
운영기관
-
AR/VR과 메타버스 종료(청강)AR/VR과 메타버스
김승현
고려대학교
2025.09.09 ~ 2025.10.28-
운영기관
운영기관 고려대학교
-
주차
주차 7주
-
학습인정시간
학습인정시간 (총 동영상시간) 7시간 00분 (05시간 03분)
-
운영기관
-
미래 모빌리티 종료(청강)미래 모빌리티
김중헌
고려대학교
2025.09.09 ~ 2025.10.28-
운영기관
운영기관 고려대학교
-
주차
주차 7주
-
학습인정시간
학습인정시간 (총 동영상시간) 9시간 32분 (07시간 24분)
-
운영기관
-
공감의 뇌과학 종료(청강)공감의 뇌과학
강준
고려대학교
2025.09.09 ~ 2025.12.16-
운영기관
운영기관 고려대학교
-
주차
주차 14주
-
학습인정시간
학습인정시간 (총 동영상시간) 18시간 26분 (18시간 02분)
-
운영기관
-
인공지능 시대의 언어학 입문 진행중 이수증인공지능 시대의 언어학 입문
송상헌
고려대학교
2025.09.09 ~ 2025.12.30-
운영기관
운영기관 고려대학교
-
주차
주차 16주
-
학습인정시간
학습인정시간 (총 동영상시간) 20시간 32분 (17시간 20분)
-
운영기관
-
메타버스 스토리텔링 진행중 이수증메타버스 스토리텔링
김은정
고려대학교
2025.09.09 ~ 2025.12.30-
운영기관
운영기관 고려대학교
-
주차
주차 19주
-
학습인정시간
학습인정시간 (총 동영상시간) 18시간 20분 (14시간 40분)
-
운영기관
-
인류와 감염병 이야기 종료(청강)인류와 감염병 이야기
김우주
고려대학교
2025.09.09 ~ 2025.12.16-
운영기관
운영기관 고려대학교
-
주차
주차 15주
-
학습인정시간
학습인정시간 (총 동영상시간) 11시간 50분 (10시간 41분)
-
운영기관
-
데이터과학과 인공지능 종료(청강)데이터과학과 인공지능
신은경
고려대학교
2025.09.09 ~ 2025.10.21-
운영기관
운영기관 고려대학교
-
주차
주차 7주
-
학습인정시간
학습인정시간 (총 동영상시간) 3시간 45분 (05시간 50분)
-
운영기관
