본문 영역으로 바로가기
텍스트 마이닝 실전 및 분석 동영상

텍스트 마이닝 실전 및 분석


등록마감

강좌 개요 및 목표

최근 빅데이터 시대를 맞이하여 웹 2.0과 소셜 네트워킹 사이트들의 급격한 성장이 이루어졌습니다. 이로 인해 이메일, 신문, 블로그 등과 같은 비정형 데이터가 방대하게 생산되고 있습니다. 텍스트 마이닝은 비정형 빅데이터 분석에 핵심적인 분야로 여겨지고 있습니다. 요즘과 같은 데이터 홍수 시대에는 더욱 그 중요성이 커졌고 텍스트 마이닝에 관심을 갖는 사람들이 많아졌습니다. 뿐만 아니라 하드웨어와 소프트웨어에서의 최근의 진보는 경영학, 공공정책, 의료 정보 등 다양한 분야에서 텍스트 마이닝을 적용할 수 있게 되었습니다.
본 강의는 다양한 텍스트 마이닝 기법의 이론 및 접근방법을 설명합니다. 텍스트 마이닝이 무엇인지 알아보고, 텍스트 마이닝 기법을 직접 다루어보는 것을 목표로 삼습니다. 이를 통해 학습자들은 한글 및 영어 텍스트 요소를 단위별로 분석할 수 있고, 감성 분석, 토픽 모델링 등을 할 수 있습니다. 더 나아가 학습자가 관심 있어 하는 프로젝트나 과제 등 실생활에 텍스트 마이닝을 이용해 새로운 아이디어를 도출할 수 있습니다. 이에 따라 학습자들은 공학 지식과 더불어 텍스트 분석 및 활용 능력을 얻게 될 것입니다.
본 강의는 이론과 실습으로 구성되어 있습니다. 강의 영상을 통해 이론 수업을 진행한 뒤, yTextMiner를 이용한 실습 시연 영상을 제공합니다. 강의를 잘 이해하였는지 알아보기 위해 퀴즈와 중간고사, 기말고사를 보게 됩니다. 퀴즈는 각 차시의 강의가 끝날 때마다 이론 내용을 주로 다룹니다. 중간고사는 6주차, 기말고사는 13주차에 보게 됩니다.

수강 대상 및 선수과목

본 강의는 별도의 선수과목이 없습니다. 프로그래밍 언어를 이미 배우셨다면 Java 코드를 이해하는 데 유용하나, 아직 배우지 않으셔도 기존에 있는 데이터와 toolkit을 이용하여 결과를 확인하는 것이기 때문에 무리 없이 들을 수 있습니다.
학습자께서 공학적인 마인드와 열의를 가지고 수업에 임한다면 학습 내용을 이해하고 수행하는 데 좋습니다.

강의 운영 방향

두 차례에 걸쳐 강좌 업로드가 진행됩니다. 개강일(11/24)에 1주차~5주차 강좌가 우선 업로드되며, 12/1(금)부터 6주차~13주차 강좌가 모두 업로드됩니다.

매 주차 이메일링을 통해 각 주차에 해당하는 자료와 실습을 안내할 예정입니다. 혹시 학습하며 궁금한 점이 있으신 수강자분들은 FAQ나 Discussion 게시판을 이용하여 주시기 바랍니다.

이수 안내

평가 비중은 퀴즈(30%), 중간고사(35%), 기말고사(35%)로 나누어져 있습니다. 정해진 성적 규정을 통과한 학습자에 한하여 이수증을 발급합니다. 총점 60점 이상이 이수기준입니다.

시험 안내

중간고사

  • 유형: 객관식
  • 문항 수: 8문제
  • 문제풀이 기한: 무기한
  • 출제범위: 1주차~6주차
기말고사
  • 유형: 객관식
  • 문항 수: 8문제
  • 문제풀이 기한: 무기한
  • 출제범위: 1주차~13주차

교수 소개

송민 교수님 프로필 사진


송민 교수
現 연세대학교 문헌정보학과 정교수
min.song@yonsei.ac.kr
02-2123-2416

연세대학교 문헌정보학과를 졸업한 뒤 미국 Drexel University의 School of Information Science & Technology에서 Ph.D를 마쳤습니다.2012년 연세대학교 부교수로 부임한 이후 연구 성과의 탁월성을 인정받아 2014년 언더우드 특훈 교수로 선정되었으며 현재는 연세대학교 문헌정보학과 정교수로 재직 중입니다.
송민 교수의 전공 세부분야는 텍스트 마이닝, 바이오 인포매틱스, 정보 검색, 웹·소셜 미디어 마이닝입니다. 학부와 대학원 수업에 텍스트 마이닝 과목을 개설하고 학생들에게 텍스트 마이닝을 소개해 왔습니다. 뿐만 아니라 텍스트 마이닝에 관심 있는 사람들에게 도움을 주고 실제로 사용할 수 있도록 동기부여를 하고자『텍스트 마이닝』 (청람출판사, 2017)을 집필하였습니다. 송민 교수에 대한 자세한 사항은 연세대학교 TSMM(Text/Social Media Mining) Lab 홈페이지에서 확인할 수 있습니다.

조교 소개

학습 내용 외 기타 질문 사항이 있을 시 메일로 연락주시기 바랍니다.

- 한유경
연세대학교 문헌정보학과 석사 과정
yukyeonghan@yonsei.ac.kr
- 오혜인
연세대학교 문헌정보학과 석사 과정
ohi0202@yonsei.ac.kr

교재

『텍스트 마이닝』(송민 2017, 청람출판사)
교재 이미지입니다. 이미지를 클릭하시면 더욱 자세한 정보를 확인하실 수 있습니다.

맛보기 강좌

  1. 분야

    공학
    (컴퓨터ㆍ통신)
  2. 강좌 내용의 어려운 수준을 의미합니다. 교양, 전공기초, 전공심화 순으로 난이도가 증가합니다.

    난이도

    교양
  3. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    운영기관

    연세대학교
  4. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    주차
    (주간 학습권장시간)

    15주
    (주당 01시간 00분)
  5. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    학습인정시간
    (총 동영상시간)

    12시간 00분
    (06시간 55분)
  6. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    수강 신청 기간

    2018.03.19 ~ 2018.07.27
  7. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    강좌 운영 기간

    2018.04.02 ~ 2018.07.27