본문 바로가기

내 강의실

최근 수강강좌 목록

현재 진행중인 강좌(청강제외)만 출력됩니다.

최근접속순 최대 10개 강좌만 표시됩니다.

K-MOOC
K-MOOC 학점은행제

현재 진행중인 수강강좌가 없습니다.

수강신청 하러가기 →

현재 진행중인 수강강좌가 없습니다.

수강신청 하러가기 →
한국어
  • 한국어
  • ENGLISH

배우고 싶은 강좌를 찾아보세요.

추천 강좌

    다국어 설정

    강좌소개

    [수업내용]

    본 강의는 대용량 데이터 처리에 대한 기본적인 개념 및 절차에 대한 기본 이론 습득을 목표로 한다.
    본 강의를 통해 실 환경 (개발 프로젝트)에 적용할 수 있는 능력을 확보를 목표로 한다.
    또한, 대용량 데이터 처리 툴인 Hive에 대한 개념 및 처리 방법을 습득하여 실력을 향상 할 수 있도록 한다.

    [학습목표]
    1. 데이터 처리에 대한 기본적인 절차를 설명할 수 있다.
    2. 대용량 데이터 처리에 대한 방안을 이해하고 프로젝트 진행 시 적용 할 수 있다.
    3. Hive를 활용하여 대용량 데이터를 처리를 할 수는 개념 이해 및 개발을 할 수 있다.

    [연계과목]
    SQL 정형 데이터 분석

     홍보/예시 영상

    [강의계획서]

    1주차 메타데이터와 데이터 표준화

    데이터 처리를 하기 위해 사전에 정의 되어야 할 기본적인 사항에 대해 습득한다.

    l 1차시: 메타데이터 의미

    l 2차시: 데이터 표준화 정의

    l 3차시: 데이터 표준화 절차

    학습활동: 퀴즈

     

    2주차 ETL / CDC

    데이터 처리 흐름에 대한 개념 및 솔루션에 대한 지식을 학습한다.

    l 1차시: ETL 개념

    l 2차시: CDC 개념

    l 3차시: 대용량 고객 데이터 통합 방안

    학습활동: 퀴즈

     

    3주차 대용량데이터 Batch

    대용량 데이터의 이행 및 처리를 위한 개념을 학습한다.

    l 1차시: 대용량 데이터 이행

    l 2차시: 대용량 데이터 처리 개념

    l 3차시: 빅데이터 아키텍쳐 개념

    학습활동: 퀴즈

     

    4주차 데이터품질

    대용량 데이터를 처리하는 과정에서 발생되는 데이터의 품질에 대한 개념을 학습한다.

    l 1차시: 데이터 품질 개념

    l 2차시: 데이터 품질 관리 구성 요소 및 데이터 품질 관리 프로세스1

    l 3차시: 데이터 품질 관리 프로세스 2

    학습활동: 퀴즈

     

    5주차 Hive 처리 기술 1

    대용량 데이터 처리를 지원하는 Hive에 대한 이해와 특성을학습한다.

    l 1차시: Hive 이해

    l 2차시: Hive 서비스

    l 3차시: Hive 메타스토어 이해

    학습활동: 퀴즈

     

    6주차 Hive 처리 기술 2

    대용량 데이터 처리를 위한 데이터 유형과 데이터베이스 구성에 대한 개념을 학습한다.

    l 1차시: Hive 데이터베이스 & 테이블 이해와 DB 구성

    l 2차시: Hive 데이터 속성과 데이터 적재 및 삭제 방법

    l 3차시: Hive DB, Table 생성을 위한 실습

    학습활동: 퀴즈 / 토론

     

    7주차 Hive 처리 기술 3

    Hive를지원하는 함수등의 이해를 통해 Hive를 활용에 대해학습한다.

    l 1차시: Hive 함수의 이해와 사용 방법

    l 2차시: Hive 관리 명령어와 트랜잭션 처리

    l 3차시: Hive DB, Table 생성을 위한 실습

    학습활동: 퀴즈 / 과제

     

    8주차 총괄평가(시험) 

    [이수/평가정보]

    l 퀴즈: 20%

    l 과제 :30%

    l  총괄평가(시험) :50%

    60점 충족 시 이수증 발부

    강좌 수준 및 선수요건

    - 특별한 선수 요건 없음

    교재 및 참고문헌

    [교재]
    강의자료를 PDF파일로 제공합니다.

    강좌운영진
    • 김현철 교수

      ■ 소속 : 데이터스트림즈 제품서비스본부 상무

      ■ 학력 : 국민대학교 공학 석사

      ■ 현) POSCO 빅데이터 시스템 구축

      ■ 전) 국회사무처 데이터 표준화 시스템 구축

      ■ 전) 하나은행 (구 외환은행) 국내 은행권 최초 차세대 시스템 구축

      ■ E-mail : hckim@datastreams.co.kr


    • 권서연 튜터

      ■ 소속 : 고려사이버대학교 매치업 과정 튜터

      ■ 학력 : 고려대학교 심리학 석사과정

      ■ E-mail : nozomi953@naver.com

    분야 공학 (컴퓨터 · 통신)

    난이도 전공기초

    운영기관 고려사이버대학교(매치업)

    이수증 미발급

    주차 8 주

    학습인정시간 14시간 40분 (09시간 44분)

    수강신청기간 24.07.08 ~ 24.09.01

    강좌운영기간 24.07.22 ~ 24.09.15

    전화번호 -

    자막언어 -

    강좌언어 한국어(ko)

    추천강좌
    같은기관강좌