강화학습의 수학적 기초와 알고리듬 이해

이용약관

제1장 총칙

제1조 (목적)

이 약관은 국가평생교육진흥원(이하 “진흥원”)이 운영하는 “K-MOOC 홈페이지”(이하 “K-MOOC”)가 제공하는 모든 회원 정보 서비스(이하 ‘서비스’)를 이용하는 고객(이하 “회원”)과 ‘진흥원’이 ‘서비스’의 이용에 관한 조건 및 절차와 기타 필요한 사항을 규정하는 것을 목적으로 합니다.

제2조 (약관의 효력과 변경)

① 이 약관은 “이 약관에 동의하십니까?”라는 물음에 ‘회원’이 “동의” 버튼을 클릭함으로써 효력이 발생합니다.

② ‘진흥원’은 이 약관을 임의로 변경할 수 있으며, 변경된 약관은 적용일 전 7일간 ‘회원’에게 공지되고 적용 일에 효력이 발생 됩니다.

③ ‘회원’은 변경된 약관에 동의하지 않을 경우, ‘서비스’ 이용을 중단하고 탈퇴할 수 있습니다. 약관이 변경된 이후에도 계속 ‘서비스’를 이용하는 경우에는 ‘회원’이 약관의 변경 사항에 동의한 것으로 봅니다.

제3조 (약관 외 준칙)

이 약관에 명시되지 않은 사항이 관계 법령에 규정되어 있으면 그 규정에 따릅니다.

제2장 회원 가입과 서비스 이용

제4조 (이용계약)

‘서비스’ 이용은 ‘진흥원’이 허락하고 ‘회원’이 약관 내용에 대해 동의하면 됩니다.

제5조 (이용신청)

① 본 서비스를 이용하기 위해서는 ‘진흥원’이 정한 소정의 양식에 이용자 정보를 기록해야 합니다.

② 가입신청 양식에 기재된 이용자 정보는 실제 데이터로 간주합니다. 실제 정보를 입력하지 않은 사용자는 법적으로 보호받을 수 없습니다.

제6조 (이용신청의 승낙)

① ‘진흥원’은 ‘회원’이 모든 사항을 정확히 기재하여 신청할 경우 ‘서비스’ 이용을 승낙합니다. 다만, 아래의 경우는 예외로 합니다.

1. 다른 사람의 명의를 사용하여 신청한 경우

2. 회원가입 신청서의 내용을 허위로 기재하였거나 신청하였을 경우

3. 사회의 안녕질서 또는 미풍양속을 저해할 목적으로 신청한 경우

4. 다른 사람의 K-MOOC 서비스 이용을 방해하거나 그 정보를 도용하는 등의 행위를 하였을 경우

5. K-MOOC를 이용하여 법령과 본 약관이 금지하는 행위를 하는 경우

6. 기타 ‘진흥원’이 정한 회원가입 요건이 미비할 경우

② 회원이 입력하는 정보는 아래와 같습니다. 아래의 정보 외에 ‘진흥원’은 ‘회원’에게 추가 정보의 입력을 요구할 수 있습니다.

- 필수항목 : 전자우편주소, 성명, 아이디, 비밀번호, 성별, 출생연도

- 선택항목 : 보조전자우편주소, 도시, 국가, 거주지, 최종학력, 가입목적

제7조 (계약 사항의 변경 및 정보 보유/이용 기간)

① ‘회원’은 ‘서비스’ 이용 신청 시 기재한 사항이 변경되었을 경우, 온라인으로 수정해야 합니다.

② ‘회원’으로 등록하는 순간부터 ‘진흥원’은 ‘회원’의 정보를 보유 및 이용할 수 있습니다.

③ ‘회원’이 탈퇴하는 순간부터 ‘진흥원’은 ‘회원’의 정보를 이용할 수 없습니다. 다만, ‘진흥원’은 개인정보보호를 위해 ‘회원’이 탈퇴하는 순간부터 1개월간 ‘회원’의 정보를 보유할 수 있습니다.

제8조 (쿠키에 의한 개인정보 수집)

① ‘K-MOOC’는 사용자마다 특화된 서비스를 제공하기 위해 사용자 개인용 컴퓨터에 쿠키를 전송합니다.

② 사용자가 한 번의 로그인으로 편리하게 이용하기 위해서는 쿠키 수신을 허용해야 합니다.

③ 쿠키는 ‘K-MOOC’를 방문하는 사용자의 특성을 파악하기 위해 사용됩니다.

④ 사용자는 웹브라우저에 있는 옵션기능을 조정하여 쿠키를 선택적으로 받아들일 수 있습니다. 쿠키 수신을 거부할 경우 로그인이 필요한 서비스를 이용할 수 없습니다.

제3장 계약해지

제9조 (계약해지)

① ‘회원’은 온라인을 통해 회원 정보처리에 관한 불만 사항을 개진할 수 있습니다.

② ‘회원’이 ‘서비스’ 이용 계약을 해지하고자 할 때는 본인 확인이 가능하도록 이름, 아이디, 생년월일, 연락할 수 있는 전화번호를 기재하여 전자우편으로 해지 신청을 하거나, 회원 정보수정의 ‘회원탈퇴’ 메뉴에서 탈퇴 신청을 해야 합니다.

제10조 (자격상실)

다음 각항의 사유에 해당하는 경우 ‘진흥원’은 사전 통보 없이 이용계약을 해지하거나 기간을 정하여 서비스 이용을 중지할 수 있습니다.

1. 제6조 2항의 ‘기본정보’를 누락시킨 경우

2. 가입신청 시 허위 내용으로 등록한 경우

3. 타인의 아이디와 비밀번호를 도용한 경우

4. K-MOOC, 다른 회원 또는 제3자의 지식재산권을 침해하는 경우

5. 사회의 안녕과 질서, 미풍양속을 해치는 행위를 하는 경우

6. 타인의 명예를 손상하거나 불이익을 주는 행위를 한 경우

7. ‘신용정보의 이용 및 보호에 관한 법률’에 따른 PC통신 및 인터넷 서비스의 신용불량자로 등록되는 경우

제4장 책임

제11조 (진흥원의 의무)

① ‘진흥원’과 제휴를 맺은 사이트를 편리하게 이용할 수 있도록 ‘진흥원’은 ‘회원’의 정보를 제휴 사이트들과 공유할 수 있으며, 공유를 위해 ‘K-MOOC’는 ‘회원’의 컴퓨터에 쿠키를 전송할 수 있습니다.

② ‘진흥원’은 ‘서비스’ 제공으로 알게 된 ‘회원’의 신상정보를 본인의 승낙 없이 제3자에게 누설, 배포하지 않습니다. 다만, 다음 각호에 해당하는 경우에는 예외로 합니다.

1. 금융실명거래 및 비밀보장에 관한 법률, 신용정보의 이용 및 보호에 관한 법률, 전기통신기본법, 전기통신사업법, 지방세법, 소비자보호법, 한국은행법, 형사소송법 등 법령에 특별한 규정이 있는 경우

2. 통계작성/학술연구 또는 시장조사를 위하여 필요한 경우로서 특정 개인을 식별할 수 없는 형태로 제공하는 경우

3. ‘진흥원’은 ‘회원’의 전체 또는 일부 정보를 업무와 관련된 통계 자료로 사용할 수 있습니다.

4. ‘진흥원’은 ‘서비스’가 계속적이고 안정적으로 운영될 수 있도록 노력하며, 부득이한 이유로 ‘서비스’가 중단되면 지체없이 이를 수리 복구하는 데 최선을 다해 노력합니다. 다만, 천재지변, 비상사태, 시스템 정기 점검 및 ‘진흥원’이 필요한 경우에는 그 서비스를 일시 중단하거나 중지할 수 있습니다.

제12조(회원 정보 사용에 대한 동의)

① 진흥원은 K-MOOC 이외에 각종 사이트를 운영하는바, 진흥원이 운영하는 메인 사이트 및 각종 서브 사이트의 서비스 제공을 목적으로 회원의 정보를 수집하며, 수집된 회원의 정보를 사용할 수 있습니다.

② ‘진흥원’은 양질의 서비스를 위해 여러 교육 관련 유관 단체 및 비즈니스 사업자와 제휴를 맺어 회원 정보를 공유할 수 있습니다. 그럴 경우 ‘진흥원’은 본 조에 제휴업체 및 목적, 내용을 약관에 밝혀 `회원`의 동의받은 뒤 제휴업체에 제공합니다.

③ 본 조의 규정에 의한 ‘회원’의 동의는 본 약관 및 회원 가입정보 입력화면에서 제공하는 정보서비스 이용신청 버튼을 클릭함으로써 그 효력을 발생합니다.

제13조 (회원의 의무)

① 아이디와 비밀번호의 관리에 대한 책임은 ‘회원’에게 있습니다.

② ‘회원’은 자신의 아이디를 타인에게 양도, 증여, 대여하거나 타인이 사용하게 하여서는 아니 됩니다.

③ 자신의 아이디(ID)가 부정하게 사용된 경우, ‘회원’은 반드시 ‘진흥원’에 그 사실을 통보해야 합니다.

④ ‘회원’은 게시물에 등록된 데이터를 이용한 영업활동을 할 수 없습니다.

⑤ ‘회원’은 '진흥원'이 보내는 공지 메일을 수신해야 합니다.

제14조 (회원의 게시물)

① 게시물이란 ‘K-MOOC’의 각종 게시판에 회원이 올린 글 전체를 포함합니다.

② 회원이 게시하는 정보 및 질문과 대답 등으로 인해 발생하는 손실이나 문제는 전적으로 회원 개인의 판단에 따른 책임이며, ‘진흥원’의 고의가 아닌 한 ‘진흥원’은 이에 대하여 책임지지 않습니다.

③ 회원의 게시물로 인하여 제3자의 ‘진흥원’에 대한 청구, 소송, 기타 일체의 분쟁이 발생한 경우 회원은 그 해결에 드는 비용을 부담하고 ‘진흥원’를 위하여 분쟁을 처리하여야 하며, ‘진흥원’이 제3자에게 배상하거나 ‘진흥원’에 손해가 발생한 경우 회원은 ‘진흥원’에 배상하여야 합니다.

④ ‘진흥원’는 '회원'의 게시물이 다음 각 항에 해당하는 경우에는 사전통지 없이 삭제합니다. 그러나 ‘진흥원’가 게시물을 검사 또는 검열할 의무를 부담하는 것은 아닙니다.

1. 제3자를 비방하거나 중상 모략하여 명예를 손상하는 경우

2. 공공질서, 미풍양속에 저해되는 내용인 경우

3. ‘진흥원’의 저작권, 제3자의 저작권 등 기타 권리를 침해하는 내용인 경우

4. ‘진흥원’에서 규정한 게시 기간을 초과한 경우

5. 상업성이 있는 게시물이나 돈벌이 광고, 행운의 편지 등을 게시한 경우

6. 사이트의 개설 취지에 맞지 않을 경우

7. 기타 관계 법령을 위반한다고 판단되는 경우

⑤ ‘진흥원’는 ‘회원’이 등록한 게시물을 활용해 가공, 판매, 출판 등을 할 수 있습니다.

제5장 정보제공

제15조 (정보의 제공)

‘진흥원’는 ‘회원’에게 필요한 정보나 광고를 전자메일이나 서신 우편 등의 방법으로 전달할 수 있으며, ‘회원’은 이를 원하지 않을 경우 가입신청 메뉴와 회원 정보수정 메뉴에서 정보 수신 거부를 할 수 있습니다. 단, 정보 수신 거부한 ‘회원’에게도 제13조5항의 ‘진흥원’ 공지 메일을 보낼 수 있습니다.

제6장 손해배상 및 면책

제16조 (책임)

① ‘진흥원’은 ‘서비스’ 이용과 관련하여 ‘진흥원’의 고의 또는 중과실이 없는 한 ‘회원’에게 발생한 어떠한 손해에 대해서도 책임을 지지 않습니다.

② ‘진흥원’은 ‘서비스’ 이용과 관련한 정보, 제품, 서비스, 소프트웨어, 그래픽, 음성, 동영상의 적합성, 정확성, 시의성, 신빙성에 관한 보증 또는 담보책임을 부담하지 않습니다.

제17조 (면책)

‘진흥원’이 천재지변 또는 불가피한 사정으로 ‘서비스’를 중단할 경우, ‘회원’에게 발생하는 문제에 대해 책임을 지지 않습니다.

제18조 (관할법원)

‘서비스’ 이용과 관련하여 소송이 제기될 경우 ‘진흥원’의 소재지를 관할하는 법원 또는 대한민국의 민사소송법에 따른 법원을 관할법원으로 합니다.

본 약관의 해석과 적용 및 본 약관과 관련한 분쟁의 해결에는 대한민국 법이 적용됩니다.

저작권보호정책

CCL (Creative Commons License)

CCL은 자신의 창작물에 대하여 일정한 조건 하에 다른 사람의 자유로운 이용을 허락하는 내용의 자유이용 라이선스(License)입니다.

이용허락조건

Attribution(저작자 표시)

저작자의 이름, 출처 등 저작자를 반드시 표시 해야 한다는, 라이선스에 반드시 포함하는 필수조항 입니다.

Noncommercial(비영리)

저작물을 영리 목적으로 이용할 수 없습니다. 영리목적의 이용을 위해서는, 별도의 계약이 필요하다는 의미입니다.

No Derivative Works (변경금지)

저작물을 변경하거나 저작물을 이용한 2차적 저작물 제작을 금지한다는 의미입니다.

Share Alike (동일조건변경허락)

2차적 저작물 제작을 허용하되, 2차적 저작물에 원 저작물과 동일한 라이선스를 적용해야 한다는 의미입니다.

이용허락조건

저작자표시 (CC BY)

저작자표시 (CC BY)

저작자의 이름, 저작물의 제목, 출처 등 저작자에 관한 표시를 해주어야 합니다.

저작자표시-비영리 (CC BY-NC)

저작자표시-비영리 (CC BY-NC)

저작자를 밝히면 자유로운 이용이 가능하지만 영리목적으로 이용할 수 없습니다.

저작자표시-변경금지 (CC BY-ND)

저작자표시-변경금지 (CC BY-ND)

저작자를 밝히면 자유로운 이용이 가능하지만, 변경 없이 그대로 이용해야 합니다.

저작자표시-동일조건변경허락 (CC BY-SA)

저작자표시-동일조건변경허락 (CC BY-SA)

저작자를 밝히면 자유로운 이용이 가능하고 저작물의 변경도 가능하지만, 2차적 저작물에는 원 저작물에 적용된 것과 동일한 라이선스를 적용해야 합니다.

저작자표시-비영리-동일조건변경허락 (CC BY-NC-SA)

저작자표시-비영리-동일조건변경허락 (CC BY-NC-SA)

저작자를 밝히면 이용이 가능하며 저작물의 변경도 가능하지만, 영리목적으로 이용할 수 없고 2차적 저작물에는 원 저작물과 동일한 라이선스를 적용해야 합니다.

저작자표시-비영리-변경금지 (CC BY-NC-ND)

저작자표시-비영리-변경금지 (CC BY-NC-ND)

저작자를 밝히면 자유로운 이용이 가능하지만, 영리목적으로 이용할 수 없고 변경 없이 그대로 이용해야 합니다.

강화학습의 수학적 기초와 알고리듬 이해 종료(청강) 이수증
강화학습의 수학적 기초와 알고리듬 이해
- 분야 공학 (컴퓨터 · 통신)
  
  운영기관 운영기관 고려대학교 운영기관 바로가기 새창열림
  
  주차 주차 17 주
  
  수강신청기간 수강신청기간 22.08.30 ~ 22.12.21
  
  전화번호 전화번호 02-3290-1581
  
  강좌만족도 4.4
- 난이도 난이도 전공기초
  
  이수증 이수증 미발급
  
  학습인정시간 학습인정시간 29시간 30분 (17시간 54분)
  
  강좌운영기간 강좌운영기간 22.09.05 ~ 23.01.03
  
  자막언어 -
  
  강좌언어 한국어(ko)
관심강좌등록

참여기관 목록

강좌소개

■ 학습 목표: 인공지능 기계학습 분야 중 하나인 강화학습의 수학적 기초와 알고리듬에 대한 이해

■ 수업 내용: 본 강의는 인공지능의 주요분야 중 하나인 강화학습(reinforcement learning) 방법론의 기본 수학적 개념과 원리를 다루고 있습니다. 강화학습의 최신이론을 설명하는 것 대신, 강화학습을 구성하는 기본적인 원리의 이해를 돕기 위해 강화학습의 수학적인 근간이 되는 '동적계획법', '마르코브 과정', '마르코브 의사결정 프로세스' 등에 대해 그 개념을 예시와 함께 설명하고, 이를 바탕으로 강화학습 방법론들에 대해 보다 쉽게, 깊은 이해를 할 수 있도록 도움을 주는 강의입니다.

■ 추천 학습 대상 체크리스트
1. 인공지능에 관심이 있다.
2. 강화학습의 원리를 이해하고 싶다.
3. 인공지능 분야의 기초지식을 쌓고 싶다.
4. 강화학습의 주요 원리인 동적계획법, 마르코프 체인, 몬테카를로 알고리듬 등을 체계적으로 이해하고 싶다.
한 가지라도 해당된다면 이 강좌를 추천합니다!

강의계획표
주차	주제	강의명
1주차	강화학습의 이해	1.1 강화학습 개요
		1.2 Multi-armed Bandit 문제
		1.3 강화학습 맛보기
2주차	동적계획법 - 1	2.1 문제해결전략과 동적 계획법
		2.2 동적 계획법의 주요개념(1) 최적화의 원리
		2.3 동적 계획법의 주요개념(2) 중첩되는 부분문제와 역진귀납법
3주차	동적계획법 - 2	3.1 최단거리 문제 (Shortest Path)
		3.2 방문판매원 문제(Traveling Salesman Problem, TSP)
		3.3 배낭문제 (Knapsack Problem)
4주차	마르코브 과정	4.1 마르코브 프로세스 개요
		4.2 마르코브 프로세스 예시
		4.3 마르코브 보상 프로세스
5주차	마르코브 결정 프로세스 - 1	5.1 MDP 개요
5주차	마르코브 결정 프로세스 - 1	5.2 MDP 예시 - Examples of Markov Decision Process
6주차	마르코브 결정 프로세스 - 2	6.1 MDP 가치함수
6주차	마르코브 결정 프로세스 - 2	6.2 Infinite-horizon MDP
7주차	마르코브 결정 프로세스 - 3	7.1 Value Iteration
7주차	마르코브 결정 프로세스 - 3	7.2 Policy Iteration
8주차	중간고사	중간고사
9주차	강화학습 알고리듬 - 1	9.1 강화학습 Model-Free Reinforcement Learning
9주차	강화학습 알고리듬 - 1	9.2 몬테칼로 학습 Monte-Carlo Learning
10주차	강화학습 알고리듬 - 2	10.1 시간차 학습 Temporal-Difference (TD) Learning
10주차	강화학습 알고리듬 - 2	10.2 SARSA 알고리듬
11주차	강화학습 알고리듬 - 3	11.1 On-policy vs. Off-policy
11주차	강화학습 알고리듬 - 3	11.2 Q-Learning 알고리듬
12주차	딥 강화학습 - 1	12.1 인공신경망 개요
12주차	딥 강화학습 - 1	12.2 Deep Q-Network (DQN) 개요
13주차	딥 강화학습 - 2	13.1 정책경사 (Policy Gradient) 개요
13주차	딥 강화학습 - 2	13.2 정책경사 정리 (Policy Gradient Theorem) 리뷰
14주차	딥 강화학습 - 3	14.1 REINFORCE 알고리듬
14주차	딥 강화학습 - 3	14.2 Actor-Critic 알고리듬
15주차	딥 강화학습 - 4 + 강의 정리 + 전문가 사례소개 (1)	15.1 A3C 알고리듬
		15.2 강의 정리 및 요약
		15.3 학계 전문가 강연
16주차	전문가 사례소개 (2)	16.1 산업계 전문가 강연
17주차	기말고사	기말고사

교수소개

정태수: 고려대학교 산업경영공학부 부교수; 고려대학교 공학대학원 스마트제조학과 주임교수; 前)싱가포르 국립대학, 산업시스템공학과 조교수; 前)Norfolk Southern Corp., Operations Research Analyst; 前)한국전자통신연구원, 연구원; E-mail: tcheong@korea.ac.kr