User Tools

Site Tools


c:mt:2015:group_09

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
c:mt:2015:group_09 [2016/07/01 14:58]
hkimscil ↷ Page moved from class:mt:2015:group_09 to c:mt:2015:group_09
c:mt:2015:group_09 [2016/07/01 15:05] (current)
hkimscil ↷ Links adapted because of a move operation
Line 54: Line 54:
  ​빅데이터란 말 그대로 기존의 방식으론 분석하기 어려울 정도의 큰 데이터를 의미하는데 빅데이터의 개념이 발생한 12년도쯤부터 스마트폰,​ 태블릿PC 같은 스마트 기기 사용자들이 폭발적으로 증가하면서 우리 주변에 새롭게 생성되거나 유통되는 정보가 폭발적으로 증가하기 시작했다.  ​빅데이터란 말 그대로 기존의 방식으론 분석하기 어려울 정도의 큰 데이터를 의미하는데 빅데이터의 개념이 발생한 12년도쯤부터 스마트폰,​ 태블릿PC 같은 스마트 기기 사용자들이 폭발적으로 증가하면서 우리 주변에 새롭게 생성되거나 유통되는 정보가 폭발적으로 증가하기 시작했다.
  
-{{ :class:​mt:​2015:​g9-1.jpg?​nolink | 그림1 ​ 2011~2016년 월별 모바일 데이터 트래픽 증가 추이}}+{{ c:​mt:​2015:​g9-1.jpg?​nolink | 그림1 ​ 2011~2016년 월별 모바일 데이터 트래픽 증가 추이}}
 그림1 ​ 2011~2016년 월별 모바일 데이터 트래픽 증가 추이 그림1 ​ 2011~2016년 월별 모바일 데이터 트래픽 증가 추이
  
Line 63: Line 63:
 빅데이터라 불리기 위해서는 일단 데이터 집합의 크기가 커야한다. 최근 이정도의 데이터는 다양한 분야에서 심심치 않게 쏟아지고 있는데 유럽원자핵공동연구소(CERN)의 거대 가속기(LHC)에서 쏟아지는 데이터는 2010년에만 무려 13페타바이터의 데이터였으며,​ 인간 게놈 프로젝트에서 1000개의 게놈 프로젝트에서 모인 데이터가 아마존 웹서비스를 통해 무료로 공개되기 시작했는데,​ 그 양은 200테라바이트에 달한다((http://​www.1000genomes.org)). 비즈니스에서 쏟아지는 데이터도 어마어마한데 월마트에서는 현재 관리하고 있는 각종 거래 데이터가 2500 테라바이트를 넘어서고,​ 지금 이 순간에도 증가하고 있다. 미국기업 대상으로 ‘조직 내에서 분석 전용으로 관리하는 데이터 총량’을 물어본 데이터 웨어하우징 인스티튜드(TDWI)의 설문조사에 의하면, 약 37%의 기업이 이미 10테라 바이트 이상의 데이터를 갖고 있다고 응답했다. 빅데이터라 불리기 위해서는 일단 데이터 집합의 크기가 커야한다. 최근 이정도의 데이터는 다양한 분야에서 심심치 않게 쏟아지고 있는데 유럽원자핵공동연구소(CERN)의 거대 가속기(LHC)에서 쏟아지는 데이터는 2010년에만 무려 13페타바이터의 데이터였으며,​ 인간 게놈 프로젝트에서 1000개의 게놈 프로젝트에서 모인 데이터가 아마존 웹서비스를 통해 무료로 공개되기 시작했는데,​ 그 양은 200테라바이트에 달한다((http://​www.1000genomes.org)). 비즈니스에서 쏟아지는 데이터도 어마어마한데 월마트에서는 현재 관리하고 있는 각종 거래 데이터가 2500 테라바이트를 넘어서고,​ 지금 이 순간에도 증가하고 있다. 미국기업 대상으로 ‘조직 내에서 분석 전용으로 관리하는 데이터 총량’을 물어본 데이터 웨어하우징 인스티튜드(TDWI)의 설문조사에 의하면, 약 37%의 기업이 이미 10테라 바이트 이상의 데이터를 갖고 있다고 응답했다.
  
-{{:class:​mt:​2015:​g9-2.jpg?​nolink&​200|}}+{{c:​mt:​2015:​g9-2.jpg?​nolink&​200|}}
 그림2 ​ 인터넷 공간을 흐르는 다양한 데이터의 규모와 속도(2011년 기준) 그림2 ​ 인터넷 공간을 흐르는 다양한 데이터의 규모와 속도(2011년 기준)
  
Line 70: Line 70:
 단순한 큰 규모만으로 빅데이터라고 할 수 없는 이유는 현재 쏟아지는 데이터들의 형태가 매우 다양하다는 점이다. 지금까지 관리되어 왔던 데이터들은 제품 생산 내역, 유통 재고, 판매 내역 등 비교적 형태가 뚜렷하고 일정했다. 이러한 데이터를 구조적 데이터라고 부른다. 하지만 최근 쏟아지는 데이터들은 이처럼 미리 형식을 하나하나 정해놓기 어렵다. 언론사나 포털사이트에 게재된 뉴스 게시물, 거기에 달린 댓글, 블로그나 온라인 게시판에 올라오는 게시물, 유튜브에 올라와 있는 동영상, 사운드 클라우드의 음악, 사진 등 매우 다양하다. 이러한 데이터를 비구조적 데이터라고 한다. 이러한 데이터는 갈수록 그 비율이 늘어나고 있다. 단순한 큰 규모만으로 빅데이터라고 할 수 없는 이유는 현재 쏟아지는 데이터들의 형태가 매우 다양하다는 점이다. 지금까지 관리되어 왔던 데이터들은 제품 생산 내역, 유통 재고, 판매 내역 등 비교적 형태가 뚜렷하고 일정했다. 이러한 데이터를 구조적 데이터라고 부른다. 하지만 최근 쏟아지는 데이터들은 이처럼 미리 형식을 하나하나 정해놓기 어렵다. 언론사나 포털사이트에 게재된 뉴스 게시물, 거기에 달린 댓글, 블로그나 온라인 게시판에 올라오는 게시물, 유튜브에 올라와 있는 동영상, 사운드 클라우드의 음악, 사진 등 매우 다양하다. 이러한 데이터를 비구조적 데이터라고 한다. 이러한 데이터는 갈수록 그 비율이 늘어나고 있다.
  
-{{:class:​mt:​2015:​g9-3.jpg?​nolink&​200|}}+{{c:​mt:​2015:​g9-3.jpg?​nolink&​200|}}
 그림3 ​ 비구조적 데이터의 급증 및 비중 그림3 ​ 비구조적 데이터의 급증 및 비중
  
Line 78: Line 78:
  ​이에 따라 정보의 생성-유통-소비의 전 주기가 매우 빨라졌고 이는 빈라덴 사망 당시 정보가 전파되었던 속도를 보면 알 수 있다. 당시 그 속도가 무려 초당 5000회에 이를 정도였다. 빅데이터 시대 이정에는 어떤 사건이 일어나도 그 데이터를 수집, 처리하는데 간격이 매우 길었으나 현재는 트위터 등 거의 실시간으로 데이터를 받을 수 있다.  ​이에 따라 정보의 생성-유통-소비의 전 주기가 매우 빨라졌고 이는 빈라덴 사망 당시 정보가 전파되었던 속도를 보면 알 수 있다. 당시 그 속도가 무려 초당 5000회에 이를 정도였다. 빅데이터 시대 이정에는 어떤 사건이 일어나도 그 데이터를 수집, 처리하는데 간격이 매우 길었으나 현재는 트위터 등 거의 실시간으로 데이터를 받을 수 있다.
  
-{{:class:​mt:​2015:​g9-4.jpg?​nolink&​200|}}+{{c:​mt:​2015:​g9-4.jpg?​nolink&​200|}}
 그림4 ​ 트위터상에서 ‘빈 라덴 사망’ 소식의 전파 모습 그림4 ​ 트위터상에서 ‘빈 라덴 사망’ 소식의 전파 모습
  
Line 117: Line 117:
  
  
-{{:class:​mt:​2015:​g9-5.jpg?​nolink&​200|}} ​+{{c:​mt:​2015:​g9-5.jpg?​nolink&​200|}} ​
 그림5 빅데이터 활용에 따른 정보침해 그림5 빅데이터 활용에 따른 정보침해
  
Line 160: Line 160:
  
  
-한글파일 링크 : {{:class:​mt:​2015:​group_09_final_1_.hwp|}}+한글파일 링크 : {{c:​mt:​2015:​group_09_final_1_.hwp|}}
  
  
Line 213: Line 213:
  
 ======2차 과제====== ======2차 과제======
-{{:class:​mt:​2015:​a02_g09.hwp| 2차과제}} HWP 파일((5차과제 위키정리 미비. HWP파일 참조해서 평가))+{{c:​mt:​2015:​a02_g09.hwp| 2차과제}} HWP 파일((5차과제 위키정리 미비. HWP파일 참조해서 평가))
  
 황영규 ​ 황영규 ​
c/mt/2015/group_09.txt · Last modified: 2016/07/01 15:05 by hkimscil