Skip to main content
예측 및 분류를 위한 데이터 애널리틱스 기법  동영상

예측 및 분류를 위한 데이터 애널리틱스 기법




강좌 소개

수업내용/목표

예측 및 분류의 목적으로 데이터를 분석하는 통계기반의 기법들을 이해하고, 데이터 애널리틱스 기법을 활용하여 데이터 분석
및 응용능력을 배양한다.

홍보/예시 영상

강좌 운영 계획

 

주차별 학습 내용

주차별 학습 내용

주차

주차명

차시

차시명

학습요소

1

강좌개요 및 단순회귀모형

1-1

회귀분석, 단순회귀모형, 모형의 추정

강의영상, 퀴즈

학습목표

회귀분석의 개념에 대해 이해하고, 최소자승법에 의한 회귀계수 추정 및 오차항 분산 추정에 대해 학습한다.

1-2

회귀계수 추정량의 분포, 모형의 검정

강의영상, 퀴즈

학습목표

회귀계수 추정량의 분포를 이용하여 회귀계수에 대한 t-검정 및 회귀모형의 유의성을 위한 F-검정을 수행한다.

1-3

회귀모형의 진단, 반응치의 예측

강의영상, 퀴즈

학습목표

잔차를 통하여 회귀 모형의 가정이 성립하는지 진단하고, 평균반응치 및 미래 반응치의 예측을 다룬다.

학습

목표

1) 예측 및 분류 문제 정의 및 관련 기법들을 이해하고, 설명할 수 있다.

2) 단순회귀모형 이론에 대해 설명할 수 있다.

3) 가설 검정의 기초개념을 이해하고, 설명할 수 있다.

4) 실제 데이터에 적용하여 주어진 독립변수가 종속변수를 어떻게 설명하는 지 직접 해석할 수 있다.

2

다중회귀 모형 이론

2-1

다중회귀모형 및 모형의 추정

강의영상, 퀴즈

학습목표

다중회귀모형의 개념에 대해 이해하고, 회귀계수 및 오차항 분산의 추정과정을 설명할 수 있다.

2-2

회귀계수 추정량의 분포 및 모형의 검정

강의영상, 퀴즈

학습목표

회귀계수의 추정 및 t-검정, 그리고 회귀모형의 유의성을 검정할 수 있는 F-검정을 학습한다.

2-3

단계적 회귀분석 및 다중공선성

강의영상, 퀴즈

학습목표

추가 설명력의 개념을 이해하고, 단계적 회귀분석 결과를 해석할 수 있다. 데이터에서 다중공선성 문제를 진단하고 알맞은 방법으로 해결할 수 있다.

2-4

반응치의 예측 및 변수 변환

강의영상, 퀴즈

학습목표

데이터가 주어졌을 때 평균 및 미래 반응치와 그 신뢰 구간을 계산할 수 있다. 범주형 변수에 대하여 지시변수를 활용한 변수 변환을 다루며, 비선형 형태의 모형을 선형형태의 변환하는 방법등을 배운다.

학습

목표

1) 다중회귀모형의 추정 및 검정을 이해하고, 주어진 문제를 해결할 수 있다.

2) 단계적 회귀분석과 다중공선성을 이해하고, 적합한 변수들만을 이용해 회귀모형을 구축할 수 있다.

3) 필요한 경우 적절한 변수 변환을 통해 범주형 독립변수 및 비선형 함수 문제를 선형회귀모형으로 해결할 수 있다.

3

시계열 분석 기법

3-1

평활화 모형 및 예측 성능 척도

강의영상, 퀴즈

학습목표

평활화 모형들의 내용과 그 차이를 이해하고, 예측성능의 척도를 활용하여 분석 결과를 평가한다.

3-2

안정적 ARMA 모형, ARMA 모형의 식별과 추정

강의영상, 퀴즈

학습목표

AR, MA, ARMA 모형의 내용을 이해하고, 새로운 시계열 데이터가 주어졌을 때 어떤 모형을 따르는 지 파악할 수 있다.

3-3

비안정적 시계열 및 시계열 예측

강의영상, 퀴즈

학습목표

비시계열 데이터에 존재하는 추세, 계절성 등을 파악하여 제거할 수 있고, 이를 이용해 미래의 시계열 값을 예측할 수 있다.

학습

목표

1) 다양한 비안정적 시계열 문제들이 증가함에 따라, 본 강좌를 통해 이 문제를 해결할 수 있는 능력을 기른다.

2) 예측기법으로의 시계열분석 기법을 이해하고, 주어진 문제를 해결할 수 있다.

3) 다양한 목적에 따라 시계열 분석 기법을 응용 하여 데이터 분석에 활용할 수 있다.

4) 실제 분석하고자 하는 시계열 데이터를 직접 다루어 원하는 미래 값을 예측할 수 있다.

4

로지스틱 회귀모형 이론

4-1

분류 문제, k-인접객체범, 분류성능

강의영상, 퀴즈

학습목표

분류 문제의 개념과 k-인접객체법을 이해하고 설명할 수 있다. 분류성능 척도를 학습한다.

4-2

이분 로지스틱 회귀분석

강의영상, 퀴즈

학습목표

로지스틱 회귀 모형의 기본 개념을 이해하고 이분형 종속 변수를 예측하는 모형을 학습할 수 있다.

4-3

명목 및 서열 로지스틱 회귀모형

강의영상, 퀴즈

학습목표

종속변수의 형태에 따른 명목형 및 서열형 로지스틱 회귀 모형을 이해한다.

학습

목표

1) k-인접객체법을 학습하고 활용할 수 있다.

2) 분류기법으로서의 로지스틱 회귀모형 이론을 이해하고, 활용할 수 있다.

3) 분류기법의 평가척도를 이해하고, 문제해결을 위해 활용할 수 있다.

4) 종속변수의 형태에 따른 모형 구축 방법을 학습한다.

5

판별분석 이론 및 알고리즘

5-1

피셔 분류방법

강의영상, 퀴즈

학습목표

피셔 방법을 이용해 분류 경계식을 도출하고 이를 이용해 관측치를 분류할 수 있다.

5-2

선형판별분석에 의한 분류규칙

강의영상, 퀴즈

학습목표

데이터의 확률 분포와 사전 확률을 고려하여 범주별 판별함수를 구하고 이를 이용해 새로운 관측치를 분류 (범주를 예측)할 수 있다.

5-3

오분류비용 고려 및 이차판별분석

강의영상, 퀴즈

학습목표

오분류비용을 고려한 선형판별분석과 이차판별분석을 이해하고, 정오분류표를 통해 각 방법의 성능을 판단할 수 있다.

학습

목표

1) 판별분석을 위한 기초이론을 이해하고, 각각의 분석기법을 적용 사례를 토대로 설명할 수 있다.

2) 의사결정론 입각하여 판별분석을 시행할 수 있다.

3) 주어진 문제 상황에 따라 사전확률 또는 오분류비용을 적절히 고려하여 판별분석을 시행할 수 있다.

4) 상황에 가장 적합한 성능 척도를 고려하여 판별분석 결과를 평가할 수 있다.

6

트리기반 분류기법 이론

6-1

트리 기법 개요

강의영상, 퀴즈

학습목표

트리 모형의 전반적인 학습 과정을 익히고, 각 과정에 적용하는 기법들의 내용을 이해한다.

6-2

트리의 형성

강의영상, 퀴즈

학습목표

분지 기준을 이해하고, 분지 기준이 되는 척도를 활용하여 트리를 형성할 수 있다.

6-3

가지치기 및 최적트리

강의영상, 퀴즈

학습목표

CART에서의 비용-복잡도 척도를 통해 가지치기를 하고, 가지치기된 후보 트리들 중에서 최적트리를 결정할 수 있다.

학습

목표

1) 실제 새로운 데이터에 대해 분류를 해야 하는 많은 문제들이 존재함을 깨닫고, 본 강의에서 그 해결책을 찾는다.

2) 트리기반 이론을 이해하고, 문제해결에 활용할 수 있다.

3) CART기법의 핵심 이론을 이해하고, 데이터를 분석할 수 있다.

4) 불순도 함수를 활용하여 데이터 분석을 시행할 수 있다.

5) CART기법을 실제로 프로그래밍 툴을 통해 사용할 수 있다.

6) 새로운 데이터에 대해 분류를 해야하는 문제에 대해 직접 예측트리모형을 만들 수 있고, 중요한 독립변수를 선택할 수 있다.

7

서포트벡터머신 이론 및 알고리즘

7-1

선형 SVM - 분리가능 경우

강의영상, 퀴즈

학습목표

분리 가능한 경우를 통해 선형 SVM의 기본 개념과 KKT 조건을 이해하고, 설명할 수 있다.

7-2

선형 SVM - 분리 불가능 경우

강의영상, 퀴즈

학습목표

분리 불가능한 경우에 대해 앞의 분리 가능한 경우의 선형 SVM 모형을 확장할 수 있다.

7-3

비선형 SVM

강의영상, 퀴즈

학습목표

비선형 모형의 기본 개념과 커널 트릭을 이해하고, 설명할 수 있다.

학습

목표

1) 최적화기반의 분류기법인 서포트벡터머신의 이론을 이해하고, 설명할 수 있다.

2) KKT 조건을 이용하여 최적화할 수 있다.

3) 문제에 따른 모형 구축 방법을 이해한다.

4) 커널 트릭을 통해서 비선형 모형을 학습할 수 있다.

8

기말고사

 

강좌운영팀 소개

교수자

전치혁 professor
전치혁 교수
◯ 성명: 전치혁
◯ 소속: POSTECH 산업경영공학과
◯ E-mail: chjun@postech.ac.kr

학력
○ 1973~1977 서울대학교 자원공학과 학사
○ 1977~1979 한국과학기술원 산업공학 석사
○ 1982~1986 Univ. of California, Berkeley, Department of
Industrial Engineering and Operations Research 박사

경력
○ 1979~1982 - 한국동력자원연구소 연구원
○ 1984~1984 - Lawrence Berkeley Lab 연구원
○ 1990~1990 - University of California at berkeley 방문교수
○ 2007~2007 - University of Washington 방문교수
○ 1987~현재 - 포항공과대학교 산업경영공학과 교수

주요업적 및 수상경력
○ 논문 266, 학회발표 213, 저서 2, 특허 1
○ 백암기술상 (2002)
○ 과학기술우수논문상 (2003)
○ 정헌학술대상 (2011)

연구분야
○ 데이터마이닝, 응용통계 확률모형

강좌지원팀

김경준
김경준
성명: 김경준
소속: POSTECH 산업경영공학과
E-mail: k_kim@postech.ac.kr


정준용
정준용
성명: 정준용
소속: POSTECH 산업경영공학과
E-mail: june0227@postech.ac.kr
이택호
이택호
성명: 이택호
소속: POSTECH 산업경영공학과
E-mail: taekho.lee@postech.ac.kr

강좌 수강 정보

이수/평가정보

과제 반영 비율 
과제명 퀴즈 기말고사
반영비율 40% 60%

※ 총 60% 이상 점수 획득 시, 이수증을 발급받을 수 있습니다.

 

강좌 수준 및 선수요건

강좌수준: 중 (또는 대학교 3학년 수준)
선수요건: 기본적인 확률 및 통계, 선형 대수, 최적화에 대한 지식 필요

교재 및 참고문헌

교재
- 전치혁, 데이터마이닝 기법과 응용

참고문헌
- 전치혁, 정민근, 이혜선, 공학응용통계
- Massimiliano Marcellino, James H. Stock, Mark W. Watson (2006) "A
comparison of direct and iterated multistep AR methods for
forecasting
macroeconomic time series", Journal of Econometrics, (135):1–2,
499-526.
- Tan, Pang-Ning, M. Steinbach and V. Kumar (2006) "Introduction to
data mining", Pearson International Edition, Boston.
- Fisher, Ronald Aylmer (1936) "The use of multiple measurements in
taxonomic problems" Annals of Eugenics, 7, 179-188.
- Burges, Christopher J. C. (1998) "A tutorial on support vector
machines for pattern recognition", Data Mining and Knowledge
Discovery,
2, 121-167.

자주 묻는 질문

데이터 애널리틱스 과목을 수강하기 위해서는 어떤 사전 지식이 필요한가요?

기본적인 통계, 선형 대수, 그리고 최적화에 대한 지식이 필요합니다.

데이터 분석 시 사용하는 프로그래밍 언어는 무엇인가요?

데이터 분석 시 사용할 수 있는 프로그래밍 언어는 Python, Matlab, R, C++ 등 매우 다양하며, 특정 언어에서 제공하는 library 등을 분석에 활용할 수 있습니다.

질문에 대한 답변은 즉시 받을 수 있나요?

질문과 답변: 24시간 이내 답변 가능합니다. (게시판을 이용해 주세요! )

 

 

관련 강좌

  1. major

    Engineering
    (Industrial Engineering)
  2. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    univ_name

    POSTECHk
  3. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    Course Week
    (Estimated Effort)

    07week
    (주당 03시간 00분)
  4. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    Accredited learning time
    (Video Duration)

    10시간 00분
    (05시간 45분)
  5. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    Course Registration Period

    2019.03.18 ~ 2019.05.20
  6. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    Classes Period

    2019.03.25 ~ 2019.05.31