본문 바로가기

배우고 싶은 강좌를 찾아보세요.

추천 강좌

    다국어 설정

    강좌소개

    강좌 소개

    수업내용/목표

    예측 및 분류의 목적으로 데이터를 분석하는통계기반의기법들을이해하고, 데이터 애널리틱스 기법을 활용하여 데이터 분석
    및 응용능력을 배양한다.

    홍보/예시 영상

    강좌 운영 계획

     

    주차별 학습 내용

    주차별 학습 내용

    주차

    주차명

    차시

    차시명

    학습요소

    1

    강좌개요 및 단순회귀모형

    1-1

    회귀분석,단순회귀모형,모형의 추정

    강의영상,퀴즈

    학습목표

    회귀분석의 개념에 대해 이해하고,최소자승법에 의한 회귀계수 추정 및 오차항 분산 추정에 대해 학습한다.

    1-2

    회귀계수 추정량의 분포,모형의 검정

    강의영상,퀴즈

    학습목표

    회귀계수 추정량의 분포를 이용하여 회귀계수에 대한 t-검정및 회귀모형의 유의성을 위한 F-검정을수행한다.

    1-3

    회귀모형의 진단,반응치의 예측

    강의영상,퀴즈

    학습목표

    잔차를 통하여 회귀 모형의 가정이 성립하는지 진단하고,평균반응치 및 미래 반응치의 예측을 다룬다.

    학습

    목표

    1) 예측 및 분류 문제 정의 및 관련 기법들을 이해하고,설명할 수 있다.

    2) 단순회귀모형 이론에 대해 설명할 수 있다.

    3) 가설 검정의 기초개념을 이해하고,설명할 수 있다.

    4) 실제 데이터에 적용하여 주어진 독립변수가 종속변수를 어떻게 설명하는 지 직접 해석할 수있다.

    2

    다중회귀 모형 이론

    2-1

    다중회귀모형 및 모형의 추정

    강의영상,퀴즈

    학습목표

    다중회귀모형의 개념에 대해 이해하고,회귀계수 및 오차항 분산의 추정과정을 설명할 수 있다.

    2-2

    회귀계수 추정량의 분포 및 모형의 검정

    강의영상,퀴즈

    학습목표

    회귀계수의 추정 및 t-검정,그리고 회귀모형의 유의성을 검정할 수 있는 F-검정을학습한다.

    2-3

    단계적 회귀분석 및 다중공선성

    강의영상,퀴즈

    학습목표

    추가 설명력의 개념을 이해하고,단계적 회귀분석 결과를 해석할 수 있다.데이터에서 다중공선성 문제를 진단하고 알맞은 방법으로 해결할 수 있다.

    2-4

    반응치의 예측 및 변수 변환

    강의영상,퀴즈

    학습목표

    데이터가 주어졌을 때 평균 및 미래 반응치와 그 신뢰 구간을 계산할 수 있다.범주형 변수에 대하여 지시변수를 활용한 변수 변환을 다루며,비선형 형태의 모형을 선형형태의 변환하는 방법등을 배운다.

    학습

    목표

    1) 다중회귀모형의 추정 및 검정을 이해하고,주어진 문제를 해결할 수 있다.

    2) 단계적 회귀분석과 다중공선성을 이해하고,적합한 변수들만을 이용해 회귀모형을 구축할 수 있다.

    3) 필요한 경우 적절한 변수 변환을 통해 범주형 독립변수 및 비선형 함수 문제를 선형회귀모형으로 해결할 수있다.

    3

    시계열 분석 기법

    3-1

    평활화 모형 및 예측 성능 척도

    강의영상,퀴즈

    학습목표

    평활화 모형들의 내용과 그 차이를 이해하고,예측성능의 척도를 활용하여 분석 결과를 평가한다.

    3-2

    안정적 ARMA 모형,ARMA 모형의 식별과 추정

    강의영상,퀴즈

    학습목표

    AR, MA, ARMA 모형의 내용을 이해하고,새로운 시계열 데이터가 주어졌을 때 어떤 모형을 따르는 지 파악할 수 있다.

    3-3

    비안정적 시계열 및 시계열 예측

    강의영상,퀴즈

    학습목표

    비시계열 데이터에 존재하는 추세,계절성 등을 파악하여 제거할 수 있고,이를 이용해 미래의 시계열 값을 예측할 수 있다.

    학습

    목표

    1) 다양한 비안정적 시계열 문제들이 증가함에 따라,본 강좌를 통해 이 문제를 해결할 수 있는 능력을 기른다.

    2) 예측기법으로의 시계열분석 기법을 이해하고,주어진 문제를 해결할 수 있다.

    3) 다양한 목적에 따라 시계열 분석 기법을 응용 하여 데이터 분석에 활용할 수 있다.

    4) 실제 분석하고자 하는 시계열 데이터를 직접 다루어 원하는 미래 값을 예측할 수 있다.

    4

    로지스틱 회귀모형 이론

    4-1

    분류 문제,k-인접객체범,분류성능

    강의영상,퀴즈

    학습목표

    분류 문제의 개념과 k-인접객체법을이해하고 설명할 수 있다.분류성능 척도를 학습한다.

    4-2

    이분 로지스틱 회귀분석

    강의영상,퀴즈

    학습목표

    로지스틱 회귀 모형의 기본 개념을 이해하고 이분형 종속 변수를 예측하는 모형을 학습할 수있다.

    4-3

    명목 및 서열 로지스틱 회귀모형

    강의영상,퀴즈

    학습목표

    종속변수의 형태에 따른 명목형 및 서열형 로지스틱 회귀 모형을 이해한다.

    학습

    목표

    1) k-인접객체법을학습하고 활용할 수 있다.

    2) 분류기법으로서의 로지스틱 회귀모형 이론을 이해하고,활용할 수 있다.

    3) 분류기법의 평가척도를 이해하고,문제해결을 위해 활용할 수 있다.

    4) 종속변수의 형태에 따른 모형 구축 방법을 학습한다.

    5

    판별분석 이론 및 알고리즘

    5-1

    피셔 분류방법

    강의영상,퀴즈

    학습목표

    피셔 방법을 이용해 분류 경계식을 도출하고 이를 이용해 관측치를 분류할 수 있다.

    5-2

    선형판별분석에 의한 분류규칙

    강의영상,퀴즈

    학습목표

    데이터의 확률 분포와 사전 확률을 고려하여 범주별 판별함수를 구하고 이를 이용해 새로운 관측치를 분류(범주를예측)할수 있다.

    5-3

    오분류비용 고려 및 이차판별분석

    강의영상,퀴즈

    학습목표

    오분류비용을 고려한 선형판별분석과 이차판별분석을 이해하고,정오분류표를 통해 각 방법의 성능을 판단할 수 있다.

    학습

    목표

    1) 판별분석을 위한 기초이론을 이해하고,각각의 분석기법을 적용 사례를 토대로 설명할 수 있다.

    2) 의사결정론 입각하여 판별분석을 시행할 수 있다.

    3) 주어진 문제 상황에 따라 사전확률 또는 오분류비용을 적절히 고려하여 판별분석을 시행할 수있다.

    4) 상황에 가장 적합한 성능 척도를 고려하여 판별분석 결과를 평가할 수 있다.

    6

    트리기반 분류기법 이론

    6-1

    트리 기법 개요

    강의영상,퀴즈

    학습목표

    트리 모형의 전반적인 학습 과정을 익히고,각 과정에 적용하는 기법들의 내용을 이해한다.

    6-2

    트리의 형성

    강의영상,퀴즈

    학습목표

    분지 기준을 이해하고,분지 기준이 되는 척도를 활용하여 트리를 형성할 수 있다.

    6-3

    가지치기 및 최적트리

    강의영상,퀴즈

    학습목표

    CART에서의비용-복잡도척도를 통해 가지치기를 하고,가지치기된 후보 트리들 중에서 최적트리를 결정할 수 있다.

    학습

    목표

    1) 실제 새로운 데이터에 대해 분류를 해야 하는 많은 문제들이 존재함을 깨닫고,본 강의에서 그 해결책을 찾는다.

    2) 트리기반 이론을 이해하고,문제해결에 활용할 수 있다.

    3) CART기법의핵심 이론을 이해하고,데이터를 분석할 수 있다.

    4) 불순도 함수를 활용하여 데이터 분석을 시행할 수 있다.

    5) CART기법을실제로 프로그래밍 툴을 통해 사용할 수 있다.

    6) 새로운 데이터에 대해 분류를 해야하는 문제에 대해 직접 예측트리모형을 만들 수 있고,중요한 독립변수를 선택할 수 있다.

    7

    서포트벡터머신 이론 및 알고리즘

    7-1

    선형 SVM - 분리가능 경우

    강의영상,퀴즈

    학습목표

    분리 가능한 경우를 통해 선형 SVM의기본 개념과 KKT 조건을 이해하고,설명할 수 있다.

    7-2

    선형 SVM - 분리 불가능 경우

    강의영상,퀴즈

    학습목표

    분리 불가능한 경우에 대해 앞의 분리 가능한 경우의 선형 SVM 모형을 확장할 수 있다.

    7-3

    비선형 SVM

    강의영상,퀴즈

    학습목표

    비선형 모형의 기본 개념과 커널 트릭을 이해하고,설명할 수 있다.

    학습

    목표

    1) 최적화기반의 분류기법인 서포트벡터머신의 이론을 이해하고,설명할 수 있다.

    2) KKT 조건을 이용하여 최적화할 수 있다.

    3) 문제에 따른 모형 구축 방법을 이해한다.

    4) 커널 트릭을 통해서 비선형 모형을 학습할 수 있다.

    8

    기말고사

     

    강좌운영팀 소개

    교수자

    전치혁 professor
    전치혁 교수
    ◯ 성명: 전치혁
    ◯ 소속: POSTECH 산업경영공학과
    ◯ E-mail: chjun@postech.ac.kr

    학력
    ○ 1973~1977 서울대학교 자원공학과 학사
    ○ 1977~1979 한국과학기술원 산업공학 석사
    ○ 1982~1986 Univ. of California, Berkeley, Department of
    Industrial Engineering and Operations Research 박사

    경력
    ○ 1979~1982 - 한국동력자원연구소 연구원
    ○ 1984~1984 - Lawrence Berkeley Lab 연구원
    ○ 1990~1990 - University of California at berkeley 방문교수
    ○ 2007~2007 - University of Washington 방문교수
    ○ 1987~현재 - 포항공과대학교 산업경영공학과 교수

    주요업적 및 수상경력
    ○ 논문 266, 학회발표 213, 저서 2, 특허 1
    ○ 백암기술상 (2002)
    ○ 과학기술우수논문상 (2003)
    ○ 정헌학술대상 (2011)

    연구분야
    ○ 데이터마이닝, 응용통계 확률모형

    강좌지원팀

    조현재
    조현재
    성명: 조현재
    소속: POSTECH 산업경영공학과
    E-mail: present@postech.ac.kr


    강좌 수강 정보

    이수/평가정보

    과제 반영 비율 
    과제명퀴즈기말고사
    반영비율40%60%

    ※ 총 60% 이상 점수 획득 시, 이수증을 발급받을 수 있습니다.

     

    강좌 수준 및 선수요건

    강좌수준: 중 (또는 대학교 3학년 수준)
    선수요건: 기본적인 확률 및 통계, 선형 대수, 최적화에 대한 지식 필요

    교재 및 참고문헌

    교재
    - 전치혁, 데이터마이닝 기법과 응용

    참고문헌
    - 전치혁, 정민근, 이혜선, 공학응용통계
    - Massimiliano Marcellino, James H. Stock, Mark W.Watson(2006)"A
    comparison of direct and iterated multistep AR methods for
    forecasting
    macroeconomic time series", Journal of Econometrics, (135):1–2,
    499-526.
    - Tan, Pang-Ning, M. Steinbach and V. Kumar(2006)"Introductionto
    data mining", Pearson International Edition, Boston.
    - Fisher, Ronald Aylmer (1936) "The use ofmultiplemeasurementsin
    taxonomic problems" Annals of Eugenics, 7, 179-188.
    - Burges, Christopher J. C. (1998) "A tutorial on supportvector
    machines for pattern recognition", Data Mining and Knowledge
    Discovery,
    2, 121-167.

    자주 묻는 질문

    데이터 애널리틱스 과목을 수강하기 위해서는어떤사전지식이 필요한가요?

    기본적인 통계, 선형 대수, 그리고 최적화에 대한 지식이 필요합니다.

    데이터 분석 시 사용하는프로그래밍언어는무엇인가요?

    데이터 분석 시 사용할 수 있는 프로그래밍 언어는 Python, Matlab, R, C++ 등 매우다양하며,특정언어에서 제공하는 library 등을 분석에 활용할 수 있습니다.

    질문에 대한 답변은 즉시 받을 수 있나요?

    질문과 답변: 24시간 이내 답변 가능합니다. (게시판을 이용해 주세요! )

     

     

    미리보기

    분야 공학 (산업)

    난이도 전공기초

    운영기관 포항공과대학교

    이수증 미발급

    주차 7 주

    학습인정시간 10시간 00분 (05시간 20분)

    수강신청기간 21.05.03 ~ 21.08.31

    강좌운영기간 21.05.03 ~ 21.08.31

    전화번호 054-279-8107

    자막언어 -

    강좌언어 한국어(ko)

    추천강좌
    같은기관강좌