본문 바로가기

배우고 싶은 강좌를 찾아보세요.

추천 강좌

    다국어 설정

    강좌소개
    [수업내용]

    본 강의는 Python을 활용한 비정형 데이터 분석 과정으로 WebCrawling기술과 머신러닝을 활용한 Text분석의 다양한 기법을 익힘과 활용을 목표로 한다.
    실무에 적용할 수 있는 예제 포함한 학습을 통하여 빅데이터 비정형 분야의 실력을 향상할 수 있도록 한다.


    [학습목표]
    1. 비정형 분석에 대하여 이해하고 다양한 문제 해결에 활용할 수 있다.
    2. 비정형 분석에 사용되는 지도학습 및 비지도 학습 알고리즘을 설명할 수 있다.
    3. 다양한 알고리즘을 잘알고 활용하여 문제 해결을 위한에 최적의 방법을 적용할 수 있다.

    [연계과목]
    머신러닝 빅데이터 분석

     홍보/예시 영상

     

     [강의계획서]

    1주차 텍스트 분석과 웹 스크레핑

    비정형 데이터에 대하여 이해하고, WEB 서비스의 HTML 구조를 해석 및 Python을 활용하여WEB 스크래핑을 할 수 있다.

    l 1차시: 텍스트 분석과 Python 활용

    l 2차시: HTML 구조와 웹 스크래핑

    l 3차시: 정규화 및 웹 스크래핑 실습

    학습활동: 퀴즈

     

    2주차 형태소 분석 및 TDM

    문서 또는 기사의 토큰화를 위한 형태소 분석과, TDM을 생성 하여 활용할 수 있다.

    l 1차시: 형태소 분석

    l 2차시: TDM(문서 행렬)

    l 3차시: 형태소 분석 및 TDM실습(실습시뮬레이션형)

    l 학습활동 : 퀴즈

     

    3주차 주제어분석

    문서간의 유사도 및 군집 분석을 통한 분류를 진행 하고,주제어(Topic) 분석하여 주요 내용을 파악 할 수있다.

    l 1차시: 문서 유사도 분석

    l 2차시: Topic(주제분석

    l 3차시: 문서 유사도 및  주제 분석 실습

    학습활동: 퀴즈


    4주차 머신러닝활용 감성분석

    머신 러닝에 대한 이해와 감성 사전 구축 및 인공신경망 활용 감성 분석을 진행 할 수 있다.

    l 1차시: 감성 사전 활용 감성 분석

    l 2차시: 머신러닝 활용 감성 분석

    l 3차시: 감성분석 실습(keras활용)(실습시뮬레이션형)

    학습활동: 퀴즈

     

    5주차 머신러닝 활용 이미지 분석

    이미지 데이터에 대한 전처리 방법과 인공신경망을 활용한 이미지 분류 분석을 할 수 있다.

    l 1차시: 이미지 지도 학습

    l 2차시: 머신 러닝 활용 이미지 분류 실습

    l 3차시: CNN 활용 실습

    학습활동: 퀴즈

     

    6주차 RMM (LSTM) 활용 분석

    순환신경망 모형에 대하여 알고, RNN 활용 감성 분석과LSTM 활용한 언어 모형을 만들 수 있다.

    l 1차시: RNN 분석

    l 2차시: RNN 활용 감성 분석 실습

    l 3차시: RNN 활용 언어 모형 실습

    학습활동: 퀴즈 / 토론

     

    7주차 워드 임베딩(Word2Vec)

    워드 임베딩의 목적과 활용을 알고, Word2VecKeras 활용하여 실습 할 수 있다.

    l 1차시: 단어 임베딩과 Word2Vec

    l 2차시: Word2Vec 실습

    l 3차시: 비정형 분석 발전 동향

    학습활동: 퀴즈 / 과제

     

    8주차 총괄평가(시험) 


    [이수/평가정보]

             l 퀴즈: 20%

             l 과제 :30%

             l 총괄평가(시험) : 50%

                  60점 충족 시 이수증 발부


    강좌 수준 및 선수요건

    - 특별한 선수 요건 없음

    교재 및 참고문헌

    [교재]
    강의자료를 PDF파일로 제공합니다.

    강좌운영진
    • 김민철 교수

      ■ 소속 : 데이터스트림즈 AI데이터센터/AI 분석그룹/그룹장/이사

      ■ 학력 : 국민대학교 경영대학원/빅데이터경영MBA

      ■ 현) NIA 플래그쉽 사업 1위(신용보증기금 컨소) 선정 기획 및 수행

      ■ 전) 신용보증기금 빅데이터 분석 사업 수행

      ■ 전) 한국체육진흥공단 인공지능을 활용한 K-Brain 사업 수행

      ■ E-mail : mckim@datastreams.co.kr


    • 박나린 튜터

      ■ 소속 : 고려사이버대학교 매치업 과정 튜터

      ■ 학력 : 성균관대학교 통계학 석사과정

      ■ E-mail : annie9166@naver.com

    분야 공학 (컴퓨터 · 통신)

    난이도 전공기초

    운영기관 고려사이버대학교(매치업)

    이수증 미발급

    주차 8 주

    학습인정시간 14시간 25분 (09시간 29분)

    수강신청기간 24.07.08 ~ 24.09.01

    강좌운영기간 24.07.22 ~ 24.09.15

    전화번호 -

    자막언어 -

    강좌언어 한국어(ko)

    추천강좌
    같은기관강좌