Skip to main content
비정형 데이터 분석 이미지

비정형 데이터 분석




강좌 소개

수업내용/목표

[수업내용]
본 강의는 Python을 활용한 비정형 데이터분석과정으로WebCrawling기술과머신러닝을활용한Text분석의다양한기법을익힘과 활용을 목표로 한다.
실무에 적용할 수 있는 예제 포함한 학습을 통하여 빅데이터 비정형 분야의 실력을 향상할 수 있도록 한다.

[학습목표]
1. 비정형 분석에 대하여 이해하고 다양한 문제 해결에 활용할 수 있다.
2. 비정형 분석에 사용되는 지도학습 및 비지도 학습 알고리즘을 설명할 수 있다.
3. 다양한 알고리즘을 잘알고 활용하여 문제 해결을 위한에 최적의 방법을 적용할 수 있다.

[연계과목]
머신러닝 빅데이터 분석

홍보/예시 영상

강좌 운영 계획

[강의계획서]

1주차 텍스트 분석과 웹 스크레핑

비정형 데이터에 대하여 이해하고, WEB 서비스의 HTML 구조를 해석 및 Python을 활용하여 WEB 스크래핑을 할 수 있다.

l  1차시 : 텍스트 분석과 Python 활용

l  2차시 : HTML 구조와 웹 스크래핑

l  3차시 : 정규화 및 스크래핑 실습

 

2주차 형태소 분석 및 TDM

문서 또는 기사의 토큰화를 위한 형태소 분석과, TDM을 생성 하여 활용 할 수 있다.

l  1차시 : 형태소 분석

l  2차시 : TDM(문서 행렬)

l  3차시 : 형태소 분석 및 TDM 실습(실습시뮬레이션형)

l  학습활동 : 퀴즈

 

3주차주제어 분석

문서간의 유사도 및 군집 분석을 통한 분류를 진행 하고, 주제어(Topic) 분석하여 주요 내용을 파악 할 수 있다.

l  1차시 : 문서 유사도 분석

l  2차시 : Topic(주제) 분석

l  3차시 : 문서 유사도 및  주제 분석 실습

 

4주차머신러닝 활용 감성분석

머신 러닝에 대한 이해와 감성 사전 구축 및 인공신경망 활용 감성 분석을 진행 할 수 있다.

l  1차시 : 감성 사전 활용 감성 분석

l  2차시 : 머신러닝 활용 감성 분석

l  3차시 : 감성분석 실습(keras 활용)(실습시뮬레이션형)

l  학습활동 : 퀴즈

 

5주차 머신러닝 활용 이미지 분석

이미지 데이터에 대한 전처리 방법과 인공신경망을 활용한 이미지 분류 분석을 할 수 있다.

l  1차시 : 기계 학습을 위한 이미지 데이터 전처리

l  2차시 : 머신 러닝 활용 이미지 분류 분석 실습

l  3차시 : 딥러닝(CNN) 실습

 

6주차 RMM (LSTM) 활용 분석

순환신경망 모형에 대하여 알고, RNN 활용 감성 분석과 LSTM 활용한 언어 모형을 만들 수 있다.

l  1차시 : RNNLSTM 분석

l  2차시 : RNN 활용 감성분석 실습

l  3차시 : RNN 활용 언어 모형 실습

l  학습활동 : 퀴즈

 

7주차 워드 임베딩(Word2Vec)

워드 임베딩의 목적과 활용을 알고, Word2VecKeras 활용하여 실습 할 수 있다.

l  1차시 : 단어 임베딩과 Word2Vec

l  2차시 : Keras 활용 단어 임베딩 실습

l  3차시 : 비정형 분석 발전 동향

l  학습활동 : 과제

 

8주차 총괄평가(시험) 

강좌운영팀 소개

교수자

김민철 professor
김민철 교수
∙소속 : 데이터스트림즈 AI데이터센터/AI 분석그룹/그룹장/이사
∙학력 : 국민대학교 경영대학원/빅데이터경영MBA
∙주요경력 :
- 현) NIA 플래그쉽 사업 1위(신용보증기금 컨소) 선정 기획 및 수행
- 전) 신용보증기금 빅데이터 분석 사업 수행
- 전) 한국체육진흥공단 인공지능을 활용한 K-Brain 사업 수행
∙E-mail: mckim@datastreams.co.kr

강좌지원팀

장준익 튜터
장준익 튜터
∙소속 : 고려사이버대학교 매치업 과정 튜터
∙학력 : 고려사이버대학교 융합정보대학원 정보학 석사
∙E-mail: chajoon@cuk.edu

강좌 수강 정보

이수/평가정보

[이수/평가정보]

l  퀴즈 : 20%

l  과제 : 30%

l  총괄평가(시험) : 50%

60점 충족 시 이수증 발부

강좌 수준 및 선수요건

- 특별한 선수 요건 없음

교재 및 참고문헌

[교재]
강의자료를 PDF파일로 제공합니다.

자주 묻는 질문

관련 강좌

현재 강좌와 관련있는 강좌를 찾을 수 없습니다.
  1. Subject

    Engineering
    (null)
  2. 강좌 내용의 어려운 수준을 의미합니다. 교양, 전공기초, 전공심화 순으로 난이도가 증가합니다.

    Course difficulty

    advanced
  3. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    Institution

    CYBER UNIVERSITY OF KOREA(matchup)
  4. 운영 기관의 전화번호 입니다.

    Phone

    -
  5. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    Course Week
    (Estimated Effort)

    08week
    (주당 01시간 48분)
  6. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    Accredited learning time
    (Video Duration)

    14시간 25분
    (09시간 25분)
  7. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    Registration Period

    2023.04.17 ~ 2023.06.18
  8. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    Classes Period

    2023.05.08 ~ 2023.07.02
  9. ※ 만족도 응답 표본 수 미달 등 일정 기준이 충족되지 않은 경우 별점이 공개되지 않을 수 있습니다.
Enroll