그룹구성원

제 12조 그룹구성원

오준엽(wlfkq90)
- 안녕하세요 미디어학부 10학번 오준엽입니다. 저의 취미는 음악과 미술입니다. 락이나 아이돌은 많이 좋아하지 않지만 재즈나 힙합, 발라드까지 음악은 가리지 않고 즐깁니다. 올해 5월에 있을 ‘서울 재즈 페스티벌’을 갈 생각에 벌써부터 기분이 들떠 있습니다. 다음으로 미술이라고 뭉뚱그려서 이야기하게 된 저의 취미는 패션부터 순수미술등 미술이라고 얘기하는 다양한 분야에 많은 관심이 있기 때문입니다. 고등학교 때에는 디자인 관련 분야를 가야지라는 막연한 생각을 하다가 어쩌다 보니 미디어학과에 들어오고 곧 졸업을 앞두게 되었습니다. 그렇다보니 나름대로 많은 시행착오를 겪고, 제가 지금 공부를 하는 미디어라는 분야에서도 프로그래밍보다는 디자인적인 부분, 즉 시각화에 대해서 관심이 많습니다. 사실, 프로그래밍에 대한 부분은 고학년이 되어도 여전히 어렵고 저에게는 아픈 손가락입니다. 이렇게 저를 아프게(?) 만들게 된 가장 큰 이유는 디자인이나 기획 등 제가 관심이 있는 시각화에 관련되 수업을 중점적으로 수강했기 때문입니다. 많은 수업을 통해 처음에는 미디어 아트나 인터렉션 디자인을 가지고 앞으로 일을 잡으면 되겠다는 막연한 생각을 했는데 그러한 뜬구름 잡는 생각이 ‘UX Design’수업을 듣고 나서 단순하게 시각적으로 보여주는 것은 제가 속한 분야에서는 ‘빛 좋은 개살구’가 된다는 것을 알게 되었습니다. 그제서야 ‘art’와 ‘design’의 차이를 알게 된 것입니다. 스스로 많이 모른다는 것을 알고, 또한 자극받은 지금은 제가 앞으로 하고자 하는 분야를 쉽게 단정짓기 이전에 ‘사용자의 경험을 어떻게 하면 좋게 할 것인가, 나아가 그 경험을 통해 사용자가 즐거움과 동시에 불편하지 않도록 도와줄 수 있으면 좋겠다’라는 작은 신념을 가지고 공부를 하고 고민을 하는 중입니다. 이러한 생각의 실마리가 어떤 직업으로 이어질지는 모르겠지만 우선 그 직업을 ‘UX Designer’라고 막연하게 정의하고 싶습니다. 따라서 미디어 통계라는 수업을 통해서 얻고자 하는 부분은 시각적으로 발현하기 위해서 필요한 그 이전의 부분들을 더 깊이 알고자 함에 있었습니다. 사실 지금도 다양한 자료나 리서치 결과 등을 보게 되면 그 안에서 많은 표와 실험의 결과를 마주하게 됩니다. 그런데 이러한 자료를 보다보면 무슨말인지 막막해서 내려놓고 ‘그냥 이쁘게 만들면 되겠지’라는 생각을 하며 내적으로 갈등하게 된 경우가 많습니다. 혹여 보더라도 단순히 ‘number’로만 인식할 뿐 그 자체가 가지고 있는 진정한 ‘context’를 보지 못하곤 합니다. 따라서, 다른 사람이 힘써 만든 다양한 자료가 자기고 있는 숨은 의미를 파악하고, 그 안에서 새로운 통찰력과 방향을 통해 더 나은 결과물을 만드는 것이 저의 목표입니다. 여전히 간단한 질문과 물음에도 막힘이 많은 고학년인 만큼 더욱 열심히 수업에 임하도록 하겠습니다. 감사합니다.

유대원(daewon357)
- 저는 미디어학부 10학번 유대원입니다. 저는 수학, 과학 같은 이공계 과목을 좋아하고, 미술, 음악같은 창의적 예술적 과목은 잘하질 못합니다. 저는 대학교에서 전공과목을 공부하면서 제가 흥미있어하고 좋아하는 일을 찾으면서 할 수 있을거라고 생각했지만 전공학과의 프로그래밍, 디자인 수업을 들으면서 '정말 이 일이다! 재미있다' 라는 생각이 크게 와닿지는 않았습니다. 저는 어렸을 때부터 꿈이 의사였습니다. 제가 의사라는 직업을 꿈꾼 이유는 TV에서 다큐멘터리 프로그램을 자주 접하는 돈이 없다는 이유로 치료받지 못하고 병든체 힘없이 죽어가는 사람들에게 봉사하고 싶어서 이기도 하고 사람을 치료하고 살리는 일을 한다는게 정말 매력적으로 느껴졌기 때문입니다. 2010년의 저는 의대에 갈 수 있는 실력이 되지도 못하였고 이로써 저의 꿈은 정말 꿈으로 끝나는 것인가 싶었습니다. 하지만 최근에 의사의 길을 갈 수 있는 방법이 있다는 것을 알게되었고 이를 준비하고 있습니다. 목표하는 일이 생겼을 때 그 것을 이루려고하는 모든 과정은 큰 교훈이 되면서 즐겁다는 것을 이제 깨닳았습니다. 무엇인가 목표를 정하고 이를 준비한 것은 처음있는 일인지라 설레이고 흥분됩니다. 비록 전공학과와 매치되지않는 분야에 흥미를 갖고 있지만 1학년때부터 4학년동안 이 곳에서 배운 것과 얻은 것, 보람찼던 일도 정말 많았고 정말 큰 경험을 했다고 생각합니다. 남은 1년동안에도 많은 경험을 하고 배워가고 싶습니다. 감사합니다.

이종균 (yijkyun)
- 안녕하십니까. 이종균이라고 합니다. 저의 스포츠 관람하는 것을 좋아합니다. 특히 선수들이 열정적으로 뛰는 구기종목을 좋아합니다. 그중에서 축구를 제일 좋아해서 해외축구 중계를 보는것이 거의 낙이라고 할수 있습니다. 좋아하는 팀은 도르트문트, 아스날을 좋아합니다. 지금은 다들 우울한 인생들이라 명절에만 보는 사이가 돼버렸지만, 고등학교 졸업하고 친구들과 '도르트문경'이라는 팀을 만들어서 조기축구를 했던 적도 있습니다. 체력이 저질이라 3분밖에 제대로 못뛴다고 해서 등번호는 3번 이었습니다. 미디어학과에 오게된 계기는 어이없게도 이름이 예뻐서 였습니다. 지금 돌이켜보니 참 무책임했다는 생각이 드네요. 사실 전공을 60학점 넘게들었는데 내가 배운걸로 도대체 뭘 할수있을까 아직 잘 모르겠습니다. 프로그래밍 관련 전공을 주로 들었고 막연히 진로는 개발자 혹은 관리자를 생각하고 있습니다. 미디어학과 라는게 다양한 분야를 배우는 곳인지라 통계과목을 수강하게 되었습니다. 한학기 열심히 배우겠습니다. 감사합니다.

허남준(hnj0324)
안녕하세요 미디어학부 소셜미디어전공 14학번 허남준입니다. 저의 취미는 운동하는것과 맛있는 식당 찾으러 다니기 입니다. 저는 취미는 일상생활에서 벗어나 에너지를 얻을 수 있어야 한다고 생각하는데,운동과 맛집찾아다니는 것이 그 중 하나 입니다.운동을 할 땐 오로지 운동에만 집중하여 고민거리들이 생각나지 않아서 스트레스를 해소 할 수 있고 체력을 기를 수 있어 일상생활에 도움이됩니다. 운동중에서는 축구를 좋아하는데 축구는 팀워크와 체력이 중요한 경기이기 때문에 더 좋아하는 운동입니다.
학문적 관심분야는 아무래도 빅데이터 쪽 입니다. 최근에 모든 분야에서 빅데이터가 쓰이는데 교통,물류,쇼핑,금융등 정말 다양한 분야에서 쓰인다는 점에서 흥미가 생겼습니다. 저는 이 빅데이터를 방송쪽에서 활용할 수 있는 직업을 갖고 싶습니다.피디나 작가와 협업을 통해 빅데이터를 활용하여 최근 이슈들을 뽑아내어 질 좋은 콘텐츠를 기획해보고 싶습니다.

< 11조 영화-Factorial ANOVA 가설설정 >

국적과 장르가 측정할 수 있는 수치가 없다고 판단 → 토론을 통해서 국적별, 장르별 흥행을 판단할 수 있다는 것을 확인하였다.

결과적으로, 11조의 가설 설정에서 큰 문제를 발견하지 못했다.(토의 조원 :이종균,오준엽,유대원,허남준)

05월 30일 (월) 조별 토론 결과

1. '충분한 이혼경험'이라는 단어의 '충분'이 사람마다 다를 수 있다고 생각한다.

2. Random Sampling을 하는데 전체 집단에서 시도하는 건지, 특정 집단에서 하는 것인지가 모호하다. 또한 집단을 정해서 하는 것이
실제로 하기 힘든 작업입기 때문에 지금 우리의 상황에서는 덜 현실적이라고 생각하는 의견이 나왔다.

3. 종교가 원인이 아니지만 실제로 이혼을 한 사람들 중에 비슷한 종교가 많은 경우 종교가 영향을 준다는 오류를 범할 수 있다고 생각한다. 따라서 만약 종교가 원인이라고 판단하고자 한다면 다른 요인들과 비교할 수 있는 더 구체적인 설문이 필요하다고 생각하는 의견이 나왔다.

4. 여성 경제 활동 설문에서 경제력에 대한 부분이 세분화가 덜 되어있어 실제로 얼마나 영향을 주는지 판단하기 어려웠다. 따라서 경제력에 대한 부분의 설문을 조금 더 자세하게 판단할 필요가 있다고 생각한다.

5. 부부간의 긴장이라는 표현과 그 설문에 대한 내용이 사람마다 다를 수 있고 판단하기 모호한 부분이 있다. 따라서 설문보다는 이 부분의 경우,남자 10명 여자 10명을 모아서 FGI를 하여 조금 더 긴장이라는 부분에 있어서 해석의 판단 오류가 없도록 해야한다는 의견이 있었다.

—-

관심사_diffusion_of_big_data.pdf
<그룹관심사: 빅 데이터에 대한 대중의 관심 확산>

그룹과제 : 빅 데이터에 대한 대중의 관심과 확산

<가설 설정>

1. 빅 데이터의 유행과 확산은 사람들에게 이전의 방식보다 더 큰 이점을 준다는 인식과 언론에서의 노출을 통해 자신에게 적합하다는 판단이 영향을 주었다고 가정한다. (Factorial ANOVA)

2. 빅 데이터의 유행과 확산은 오피니언 리더들의 빅 데이터에 대한 언급과 주장의 증가로 인해 사람들이 빠르게 이 기술에 대해서 받아들이고 있다.(F-test)

3. 과거와는 다른 지식 창출, 공유, 습득의 기술이 빅 데이터에 관한 관심에 영향을 줬을 것이다.(F-test)

4. 빅 데이터를 활용한 트렌드 분석과 마케팅 활용은 빅 데이터에 관한 관심에 영향을 주었을 것이다.(F-test)

5. 비즈니스, 행정, 정치, 외교, 안보 등 여러분야에 걸친 빅 데이터 분석의 중요도가 빅 데이터 관심도 증가에 영향을 미칠 것이다.(Regression)

6. 언론에 빅 데이터 라는 키워드가 노출되는 빈도수가 높을수록 더많은 관심을 가질 것이다. (Regression)

7. 빅 데이터를 이용한 기업의 매출과 그렇지 않은 기업의 매출의 차가 빅 데이터에 관한 관심에 영향을 주었을 것이다.(t-test)

8. 빅데이터 솔루션을 적용한 회사의 매출과 저장된 데이터의 양, 그 회사가 사람들에게 노출된 정도 등이 빅 데이터에 대한 관심에 영향을 끼칠 것이다.(multiple regression)

<가설 종류 및 정리>

IV

1. 언론의 노출횟수 (숫자)

2. 지식 창출, 공유, 습득 방식에 대한 변화 (사회 현상학적 연구자료 검색)

3. 트렌드 분석과 마케팅 활용 (실제 사용되는 기술 발전 추이와 사람들의 인식 설문조사)

4. 빅 데이터라는 키워드 노출 빈도 확인(실제 노출되는 데이터를 추출)

5. 기업의 빅 데이터를 이용 유무의 차이로 인한 매출 차이(데이터 분석을 하는 기업과 아닌 기업의 매출차이)

6. 오피니언 리더들의 언급과 주장 (사람들의 설문조사 & 실제 언급에 대한 횟수)

CV

기업의 크기(중소기업) , 사람들 인식 (20-30대를 중심으로 실제 온라인 이용자)

DV

빅 데이터의 유행과 확산

<데이터 추출 방법 및 문제시 차선책 방안>

1. 언론의 노출횟수 (숫자) : 언론의 노출횟수의 경우, 실제로 온라인 상에서 얼마만큼 빅 데이터가 언급 되었는지 언론사의 데이터를 가지고 와서 빅 데이터 관련 단어를 중심으로 얼마나 언급된 수가 늘어났는지 확인한다. 이와 같은 방식으로 뉴스를 추출하여 전처리 과정을 통해서 단어를 솎아낸 후에 뉴스를 분석한다. 이 그림의 과정에서는 다양한 알고리즘을 사용했지만 우리가 원하는 것은 이것이 긍정적인지, 부정적인지를 확인하는 것이 아니라 언급한 횟수에 대한 부분이기 때문에 그 횟수의 증가 추이를 확인하기 위해서 빈도수 검사를 실행한다.

<그림 1>

2. 지식 창출, 공유, 습득 방식에 대한 변화 (사회 현상학적 연구자료 검색) : 사회 현상학적인 연구자료를 확인한다. 예를 들어, 빅 데이터를 실제로 이용하는 분야가 어떻게 증가 하였는지, 그 증가에 대한 부분이 어떻게 발전하게 되었는지 등 실제 사회에서 빅 데이터에 관심을 가질 수 밖에 없는 현상학적인 이유를 찾아본다. 예를 들어, ‘컴퓨터의 발전과 인터넷의 발전으로 데이터 베이스를 구축하는 서버가 발전하고, 그 서버를 많은 사람들이 이용하는 검색 엔진에서 이용하게 되고 그러한 매스 데이터가 쌓이게 되면서 자연스럽게 발전했을 것이다’라는 식의 컴퓨터 발전과 사회 발전의 관계를 분석한 논문 등을 참고하여 여러가지 사회 현상학적인 요인들을 결합하여 결과를 얻는다.

3. 트렌드 분석과 마케팅 활용 (실제 사용되는 기술 발전 추이와 사람들의 인식 설문조사) : 실제 기술이 발전된 추이를 보여주는 데이터를 보여주고, 사람들의 인식의 설문조사와 상관관계를 보여 준다. 이 경우, 년도 별 사람들의 설문조사를 얻을 수 없을 것이다. 예를 들어, 2005년 사람들의 빅 데이터에 대한 인식을 확인하는 데이터는 얻을 수 없을 것이다.

→ 따라서 이러한 경우는 이전에 빅 데이터라는 분야에 대해서 언급이 된 시점을 조사하여 그 당시 사람들이 빅 데이터에 대한 논문(2000년대)을 찾아보고, 어느정도의 예측으로 대신한다. 예를 들어, 아래 그림(2015년도 조사 자료)과 같이 업종별 미도입 사유에 대한 자료가 있다. 이 데이터가 현재(2016년)변화가 있다면 사람들이 혁신이라고 생각하는 빅 데이터의 상대적 이점, 적합성, 복잡성, 시험 가능성 등 다양한 요인의 변화가 있거나 혁신이 확산되는 단계가 변화 되었다고 볼 수 있다고 생각한다. 이처럼 기존의 다양한 데이터를 중심으로 기술 발전 추이와 함께 비교한다면 불가능한 설문조사나 부족한 질적조사를 대체할 수 있다고 생각한다.

<그림 2>

4. 빅 데이터라는 키워드 노출 빈도 확인(실제 노출되는 데이터를 추출) : 빅 데이터가 얼마나 자주 노출 되는지 확인하기 위해서 트위터 API를 이용해서 데이터를 추출한다. 트위터에서 데이터를 추출하는 이유는 트위터가 사람들이 가장 많이 실시간으로 자신의 생각을 쓰고, 텍스트로 되어 있는 자료이기 때문에 얼마나 많이 나오는지 확인하는 추이를 확인하기 용이하다고 생각했기 때문이다. 트위터API 사용 방식은 우선 트위터에서 데이터를 긁어서 가지고 온 후에 트위터 마이닝을 해주는 프로그램을 선정(자바, R 등)한 후에 그에 맞도록 데이터를 처리하여 빈도수 검사를 하여 사용한다. 실제로 트위터에서 데이터를 추출하여 검색하는 방식은 많이 사용되고 있기 때문에 추출하여 빈도를 찾아보는 빈도수 검사의 경우 어려움이 없을 것이라고 생각한다.

<그림 3>

5. 기업의 빅 데이터를 이용 유무의 차이로 인한 매출 차이(데이터 분석을 하는 기업과 아닌 기업의 매출차이): 우선 데이터를 실제로 얼마만큼 보유하고 있는지 그 추이를 확인하고, 그것을 분석할 수 있는 능력의 차이를 조사한다. 그 조사를 통해서 기업의 매출의 차이가 그러한 데이터의 차이와 가공 기술 및 활용 능력의 차이로 인해 매출이 차이가 난다는 것을 보여 준다. 이러한 방법으로 우선 기존의 기업을 분석한 다양한 자료를 찾아본다. 이러한 자료는 우선 비교 할 기업을 선정해야 하는데, 실제로 빅 데이터를 이용하여 큰 매출을 이어진 회사는 IT 분야와 마케팅 분야가 많을것이라고 생각하여 그러한 기업을 중심으로 선정한다. 앞서 이야기 한 것 처럼 대기업이 아닌 중소기업으로 통제하여 조사한다. 다음 그림은 2011년 미국 산업별 평균 데이터 보유량이다. 이와 같이 산업 별 데이터를 얼마만큼 보유 하고 있는지를 시대별로 정리하고 가장 많은 분야가 가장 데이터를 활용한다는 근거가 있다면 그 분야의 매출이 빠르게 증대 한다는 것을 보여주는 방법도 있다고 생각한다. (그림 4).

<그림 4>

또한 실제로 적용되어야 하는 분야의 종사자의 설문조사 자료를 통해서 어떻게 변화하고 있는지를 조사한다면 양적인 데이터를 중심으로 하지만 질적인 부분까지도 어느정도 충족할 수 있다고 생각한다. 하지만 이러한 데이터의 경우 없는 경우가 있을 수 있기 때문에 참고자료 정도로 이용하는 편이 좋을 것이라고 판단한다. (그림 5).

<그림 5>

6. 오피니언 리더들의 언급과 주장 (사람들의 설문조사 & 실제 언급에 대한 횟수): 실제로 오피니언 리더들이 얼마나 언급 했는지 데이터를 얻기 위해서 가장 먼저 트위터의 오피니언 리더를 중심으로 확인한다. 그 방식으로 집단 지성과 ‘빅 데이터’라는 단어가 얼마나 연결되어 이루어지고 있는지를 확인한다. 또한 빅 데이터 관련 서적과 논문이 얼마나 많이 출판되고 있는지 조사한다. 또한 그 판매량이 얼만큼인지를 확인한다. 이러한 자료를 바탕으로 전문가들이 얼마나 많이 빅데이터를 언급하고 있는지 확인할 수 있고, 사람들이 얼마나 관심을 갖고 있는지를 서적의 판매량을 통해서 확인해 본다. 아래의 그림은 트위터에서 집단 지성과 단어를 어떻게 관계 하는지 보여주는 과정이다.(그림 6)

<그림 6>

이 외에도, 언론에서 빅 데이터를 정의하는 다양한 자료가 얼마나 많이 나오는지 확인해 본다. 의제설정이론(Agenda Setting)에 근
거하여 이야기 하면 미디어의 의제설정이 실제로 공론화 되는 경우가 많은데, 빅 데이터의 경우에도 그런 의제 중 하나일 수도 있기 때문이다. 미디어가 새로운 기술 중 빅 데이터에 주목을 하고, 그것에 대해서 많이 언급함과 동시에 사람들에게 특정한 이미지를 부여했다면 그것 또한 하나의 가설 설정을 하여 확인해 볼수 있다고 생각한다. 하지만 이것 자체를 하나의 가설로 설정하여 주목하기 보다
는 다중회귀분석의 하나의 요인으로 사용하면 좋을 것이라고 사료된다. (그림 7)

<그림 7>

final_project_12조.pdf