빅데이터와 머신러닝 소프트웨어는 다양한 데이터를 분석하고 예측 모델을 만드는 소프트웨어이다. 본 강좌는 두 부분으로 구성되어 있다.
첫째, 다양한 빅데이터 분석 방법 (배치 처리, 스트림 처리, 인터액티브 질의, 그래프 처리 등)을 학습한다. 배운 개념을 활용하여 스파크/하둡 기반으로 실제 데이터 분석을 어떻게 하는지 학습한다.
둘째, 머신러닝 소프트웨어의 중요한 개념에 대해 알아보고, 다양한 머신 러닝 분석 방법을 학습힌다. 배운 개념을 활용하여 구글 텐서플로우를 기반으로 머신러닝/딥러닝 분석을 어떻게 하는지 학습한다.
학력
• 서울대학교 전자공학과 학사(1994)
• 서울대학교 전자공학과 석사(1996)
• Stanford University, Computer Science 석사 (2002)
• University of California, Berkeley, Computer Science 박사(2007)
주요경력
• 2007-2008: International Computer Science Institute (Post-doctoral Researcher)
• 2008 – 2011: Intel Labs Berkeley (Research Scientist)
• 2011 – 2012: Yahoo!Research (Research Scientist)
• 2012 – 2013: Microsoft (Principal Scientist)
• 2016 : Facebook (Research Scientist)
• 2016: 서울대학교 컴퓨터공학부 조교수
연구분야
• Operating systems
• Datacenter infrastructure / cloud computing
• Big data analytics
• Machine learning systems
총 8주차
• 강좌계획표(Syllabus)
주차 | 개강일 | 학습목표 | 학습내용 | 평가 |
---|---|---|---|---|
1주차 | 3월 3일 | 빅데이터 분석 소프트웨어의 전반적인 구성과 분석방법들을 설명할 수 있다. | 빅데이터 분석 소프트웨어 개요 | 퀴즈 |
2주차 | 3월 10일 | 빅데이터 배치 처리 방식을 설명할 수 있다. | 빅데이터 처리 시스템 개요 및 예시 | 퀴즈 |
3주차 | 3월 17일 | 빅데이터 분석 방법 중 SQL 기반 인터액티브 질의 방식을 설명할 수 있다. | 빅데이터 배치 분석 및 대화형 질의 | 퀴즈, 과제1 |
4주차 | 3월 24일 | 빅데이터 실시간 처리 방식인 스트림 처리 방식을 설명할 수 있다. | 빅데이터 스트림 분석 | 퀴즈 |
5주차 | 3월 31일 | 머신러닝 소프트웨어의 전반적인 구성에 대해 설명할 수 있다. | 그래프 처리, 머신러닝 시스템 개요 | 퀴즈 |
6주차 | 4월 7일 | 머신러닝 소프트웨어를 통해 모델을 표현하고 학습하는 방법을 설명할 수 있다 | 머신러닝/딥러닝 시스템 | 퀴즈 |
7주차 | 4월 14일 | 텐서플로우 프로그래밍을 직접 실습해 보고, 텐서플로우 프로그래밍을 설명할 수 있다. . | 텐서플로우 프로그래밍 | 퀴즈, 과제2 |
8주차 | 4월 21일 | 머신러닝 소프트웨어에서 분산학습을 설명할 수 있다. | 분산 머신러닝/딥러닝 | 퀴즈 |
평가 비율
퀴즈 | 중간/기말고사 | 과제 |
---|---|---|
80% | 0% | 20% |
※60점 충족 시 이수증 발부
교재
• 교재는 학습자료로 제공
※학습자료는 다운로드 가능
강좌 소개 영상
수강신청 기간
• 2021년 2월 17일(수) ~ 4월 13일(화)
운영 기간
• 2021년 3월 3일(수) ~ 4월 27일(화)
개설 방식
• 매주 1개 주차씩 순차 오픈
조교 : 어정윤
메일 : jeongyoon0807@gmail.com