User Tools

Site Tools


c:mt:2015:group_03

Table of Contents

1차 과제

논리실증주의에 관하여

김준영, 양현모, 박재현, 안영빈
아주대학교 미디어학부 소셜미디어 전공

초록

사회과학은 논리실증주의에 그 바탕을 두고 최근의 트렌드인 빅데이터를 활용하는 것도 이 논리실증주의의 철학과 연관 지을 수 있다. 우리는 논리실증주의가 무엇이고 왜 흥미로운지에 대해 알아보았다. 논리실증주의와 관련된 현상으로는 미국의 메이저리그에서 찾아볼 수 있었다. 미국의 메이저리그에서의 이러한 현상과 관련된 이론으로 머니볼 이론, 세이버매트릭스가 있다.
Keywords : 사회과학, 논리실증주의, 빅데이터, 메이저리그

본문

1.왜 흥미로운가?

사회적 현상을 연구하는 사회과학 은 자연과학과는 달리 규칙성을 발견하거나 이러한 현상들을 일반화시키는데 어려움이 있다. 특히나 인간의 행동이나 사고는 매우 주관적이고 비합리적이다 보니 현상이나 이론에 있어서 예외적인 부분이 쉽게 일어날 수 있다. 또한 인간의 존엄성 때문에 인간을 동식물처럼 실험할 수 도 없어서 일반적인 과학적 현상보다 증명하기가 더욱 어렵다고 볼 수 있다. 이렇다 보니 사회과학은 지속적인 연구를 통해서 사회적 현상을 경험적인 지식체계로 만들어가야 한다. 따라서 사회과학은 경험에 바탕을 두는, 즉 사실적 근거가 있고 누적적인 발전을 이루는 것이 특징인 논리실증주의를 바탕으로 한다. 논리실증주의는 검증될 수 있는 것만을 유의미한 것으로 판단하기 때문에 측정된 데이터만을 가지고 활용하는 현대사회에서 빅데이터 를 활용하는 사례와도 연관이 있다고 생각된다. 논리실증주의는 사회과학의 바탕이 되면서도 현대기술의 트렌드와도 연관 지을 수 있는 이론이라 생각한다.

2.논리실증주의와 관련된 현상

논리실증주의와 관련된 현상으로 미국의 야구에 사례가 있다. 이 사례는 영화 ‘머니볼’ (Money ball, 2011)로 아주 잘 알려져 있다. 2000년대 초반 미국 메이저리그의 꼴찌팀 오클랜드애슬레틱스의 실화이다. 오클랜드애슬레틱스의 단장 빌리 빈은 지금까지와 같은 방법으로는 승리하기 힘들다 생각하였고 그 때까지만 해도 어느 팀에서도 하지 못했던 야구를 통계학적으로 분석을 하는 빌제임스(Bill James)의 세이버메트릭스 방법론을 실제 경기에 적용시킨다. 빌리빈(Billy Beane)은 지금까지 구단에서 선수들의 이적이나 트레이드를 담당하고 있던 스카우터들의 검증되지 못한 의견들은 무시하고 오로지 선수들의 데이터를 통해서만 선수들을 영입하기에 이른다. 결과적으로 오클랜드애슬레틱스는 우승하지 못 했지만 꼴찌팀으로서 메이저리그에 유례없는 20연승이라는 기록을 세우고 또한 애슬레틱스의 팀 경영 철학을 받아들인 ‘레드삭스 ’는 1918년 이후 처음으로 월드시리즈에서 우승한다.

3.현상과 관련된 이론

미국 야구의 이러한 현상과 관련된 이론으로 빌리빈이 이용한 머니볼 이론과 빌 제임스가 창시한 세이버매트릭스(Sabermetrics)가 있다. 머니볼 이론은 홈런이나 타율이 높은 타자보다 출루율이 높은 타자가 득점의 확률이 높다고 판단하는 이론이다. 최소의 비용으로 최대의 만족을 얻는다는 경제학적 원칙을 야구단에 적용해 스타선수나 타율, 홈런 등에 대한 환상을 버리그 저비용, 고효율 구조로도 야구단이 운영될 수 있다는 것을 증명했다(박문각 시사상식편집부, 2014). 세이버매트릭스는 야구를 통계학적, 수학적으로 분석하는 방법론인데 머니볼 이론이 바로 이 세이버매트릭스에 기반한다.

참고 문헌

고한석. (2013). 빅 데이터 승리의 과학. 이지스퍼블리싱
김계홍, 김석태. (2012). 때론 속마음을, 때론 트렌드를 … 빅데이터, 목표에 꼭 맞게 분석해내라. 동아일보사
논리 실증주의,과학혁명. from http://m.blog.naver.com/garactor/70128383783
송민정. (2012). 빅 데이터가 만드는 비즈니스 미래지도. 한스미디어
박문각 시사상식편집부.(2014).시사상식사전. 박문각
안광호, 임병훈. (2005). SPSS를 활용한 사회과학 조사방법론. 학현사. 6쪽
정용찬. (2013). 빅 데이터. 커뮤니케이션북스
함유근, 채승병. (2012). 빅 데이터 경영을 바꾸다. 삼성경제연구소.
황승구 외 5명. (2013). 빅 데이터 플랫폼 전략. 전자신문사
Billy James. (2003). Historical Baseball Abstract. FreePress
Economist Intelligence Unit. (2011). Big Data Harnessing a Game-Changing Asset. The Economist.
Herschel, Gareth.(2011). Hype Cycle for Analytic Applications, Gartner.
James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh and Angela Hung Byers. (2011). Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute.
Kyoo-Sung Noh & Seung-Hee Lee. (2013). A Study on Innovative Model for Communication System of Political Parties in Korea by using Big Data. IJACT(International Journal of Advancements Computing Technology), 5(12).
Wall Street Journal. (2003). Those Who Influence The Markets Most.

2차 과제

1.빅데이터와 사회과학 : 인식론적, 방법론적 문제들, 이재현, 커뮤니케이션 이론 제9권 3호(2013년 가을호), 2013년 9월, 127-165 (39 pages)

빅데이터에 대한 최근의 관심은 세 갈래로 나누어질 수 있다. 첫째는 기술적, 공학적 관심으로, 빅데이터의 관리, 처리, 분석의 기반이 되는 기술적 시스템의 개선을 목적으로 한다. 둘째는 상업적 관심으로, 축적되어가는 빅데이터를 분석해 상업적으로 활용하거나 혁신의 계기로 삼는 것이고 셋째는 사회적 관심으로, 빅데이터가 인간학적으로, 사회정치적으로 어떤 함의를 갖는지 이해하고자 하는 것이다. 이 중에서 사회적 관심은 기술적 관심이나 상업적 관심에 비해 상대적으로 크지 않지만, 개인의 프라이버시, 사회변동과의 연관성 등 관심의 대상이 되는 주제의 중요성은 결코 작지 않다. 이 글은 빅데이터가 사회과학에 어떤 함의를 갖는지 인식론적, 방법론적 문제들을 중심으로 논의한다. 이 글의 기본적인 질문은 ‘빅데이터 시대를 맞아 사회과학의 패러다임이 변화하고 있는가’ 하는 것이다. 이 글은 인식론 차원에서 “컴퓨터연산으로의 전환”(computaitional turn)과 “데이터 추동”(data-driven)이라는 두 개념으로 이 경향을 특징지으며, 그 다음으로 방법론적 차원에서는, 빅데이터를 대상으로 한 연구가 데이터 수집, 데이터 분석, 데이터 표현 등 세가지 영역에서 어떤 특징을 보이며 어떤 문제를 제기하는지 살펴본다. 논의에 앞서 이 글에서는 빅데이터라는 용어를 맥락에 맞게 보다 정확하게 사용하기 위해 다른 용어로 대체하는데, 새로운 연구 경향을 의미할 때에는 “컴퓨터연산 과학”(computational science)이라는 용어를, 그리고 새로운 연구 방법을 지칭하고자 할 때에는 “컴퓨터연산 방법”(computational methodology)이라는 용어를 쓴다.
빅데이터의 사회과학적 함의를 인식론적, 방법론적 문제들을 중심으로 다루고자 하는 이 글을 다음과 같은 의미를 갖는다. 첫째, 빅데이터를 대상으로 한 새로운 연구 경향이 사회과학의 패러다임 변화를 이끄는가 하는 점을 다룬다는 점에서 이 글은 지식사회학적 연구의 의미를 갖는다. 둘째, 빅데이터라는 연구 자료를 수집, 분석, 표현하는 기법에 구현되어 있는 알고리즘을 구체적으로 파악하고 그 의미를 이해하고자 한다는 점에서 이 글은 최근 인문사회과학 영역에서 부각되고 있는 “소프트웨어 연구”(Software Studies)로서의 의미를 갖는다. 셋째, 이 글은 빅데이터를 둘러싼 문제들을 관념적으로만 다루는 것이 아니라 실제 연구의 절차와 방법을 구체적으로 검토하고 대안적인 방향과 지침을 모색한다는 점에서 실제적인 의미 또한 갖는다.

1)‘컴퓨터연산 사회과학’의 인식론적 문제

사회과학 분야에서 “컴퓨터연산으로의 전환”은 생물학, 물리학과 같은 자연과학 분야와 달리 느리게 진행되고 있다. 경제학, 심리학은 말할 것도 없고 거의 모든 분과에서 계량적 접근이 이미 주류로 잡은 상황에서, 역설적이게도 ‘컴퓨터연산 사회과학’의 발전은 느리게 이루어지고 있다. 그럼에도 불구하고, 이 과정에서 세가지 현상은 뚜렷이 보인다. 첫 번째로는 “컴퓨터연산 사회과학”의 연구대상 구성이 기술적 발전에 의존하고 있다는 점이다. ‘컴퓨터연산 사회과학’의 존립은 빅데이터라는 연구 자료 덕분이다. 빅데이터 없는 ‘컴퓨터연산 사회과학’은 존재할 수 없다. 이를 ‘연구대상 구성의 역설’이라 부를 수 있다. 두 번째 현상은 인문학의 경우도 마찬가지이지만, 전통적 연구와 새로운 연구 사이의 긴장과 갈등이 고조되고 있다는 것이다. 사회과학에서는 실증주의적(positivistic) 사회과학의 등장 이후 실증주의적 접근과 역사적, 해석적 접근 사이에는 치열한 논쟁과 경쟁이 계속되어 왔고, 실증주의적 과학관과 인식론에 수학, 응용통계, 컴퓨터 활용 기법 등이 결합된 컴퓨터연산 방법론은 애당초 커다란 거부감을 불러일으킬 수밖에 없다. 세 번째 현상은 “컴퓨터연산 사회과학”이 컴퓨터과학과 응용통계의 기법 도입, 그리고 컴퓨터과학과 통계물리학과의 협업에 의해 가능하다는 것이다. 사회과학이 이론적 개념과 모델을 제공한다고 해도 연구 설계, 이론적 모형과 지표의 개발, 그리고 연구의 진행에서 주도권은 상대적으로 컴퓨터과학과 통계물리학 쪽으로 기울어질 수밖에 없다.
그렇다면, ‘컴퓨터연산 사회과학’의 기저에는 어떠한 인식론적 가정들이 깔려 있는가? 이 글에서는 이 문제를, 첫째 세계에 대한 지식을 어떻게 획득할 수 있는가에 대한 지식 모델(model of intelligibility), 둘째 빅데이터로 상징되는 연구 대상을 어떻게 인식하고 있는가라는 데이터에 대한 인식, 두 가지 측면을 중심으로 살펴본다. 먼저 이른바 빅데이터의 지식 모델은 단적으로 “이론의 종언”(the end of theory)을 선언한다(Anderson, 2008). 빅데이터를 대상으로 한 ‘컴퓨터연산 과학’은 이른바 데이터 마이닝 기법을 활용해 무질서한 것처럼 보이는 방대한 데이터 속에서 상관관계를 찾아낼 수 있으며, 이런 점에서 연역이나 유추에 의거하는 전통적 접근은 물론이고 가설의 경험적 확증에 의거하는 실증주의적 접근마저도 이제는 유효하지 않다고 본다. 데이터 분석을 모든 연구과정에는 인간의 개입, 특히 해석이 필연적으로 개입될 수밖에 없다는 점에서 컴퓨터연산 방법은 가치중립적이지도 객관적이지도 않다. 두 번째로, 빅데이터로 상징되는 연구 자료를 어떻게 인식하고 있는가라는 데이터에 대한 인식을 중요한 문제로 제기한다. 보이드와 크로포드(Boyd & Crawford, 2012)도 인용한 앤더슨(Anderson, 2008)의 다음 주장은 “컴퓨터연산 과학”의 데이터관을 단적으로 드러낸다. “충분한 데이터만 주어진다면, 숫자가 스스로 말을 한다”는 주장은 기존의 모든 지식획득의 방방법론을 폐기할 정도로 과격한 것인데, 이 주장은 인간이 연구 대상이 되는 현상 속에서 특정한 패턴이나 규칙성을 드러내는 것이 아니라 데이터 자체 속에서 패턴이나 규칙성이 드러난다는 것을 의미한다(Gitelman & Jackson, 2013). 데이터에 대한 이런 인식은 다음의 세가지 원리를 내포한다.
1데이터의 크기가 일정한 수준을 넘어서면, 오류가 발생하지 않는다.
2데이터는 원천적으로 가치중립적이다.
3데이터는 인식 이전에 존재한다.
이 세가지 원리는 연구방법에서 실제적으로 확인될 수 있는 것들이다. 첫 번째는 무오류의 원리(principle of error-free data)라 부를 수 있고, 두 번째는 몰가치의 원리(principle of value-free data)라 부를 수 있으며, 세 번째는 무관심의 원리(principle of interest-free data)라 부를 수 있다.

2)‘컴퓨터연산 사회과학’의 방법론적 문제들

‘컴퓨터연산 사회과학’의 인식론적 문제들, 특히 인식 체계와 데이터에 대한 인식은 연구 수행의 실제 과정에서 방법론적 문제들로 구체화되어 나타낸다. 이 글은 방법론적 문제들을 검토함에 있어 연구과정의 핵심적인 세 영역, 데이터의 수집, 데이터의 분석, 데이터의 표현에 주목한다. 이는 앞서 제시한 데이터 대한 ‘컴퓨터연산 과학’의 세 가지 원리에 각각 대응하는 것으로서, 데이터의 수집에서는 표집의 문제를, 분석에서는 지표 구성의 문제를, 그리고 데이터 표현에서는 기각화, 특히 데이터 마이닝의 문제를 다룬다. 이 글은 방법론적 문제를 제기하고 그 한계와 의미를 드러내는 요소가 바로 알고리즘이라는 전제하에, 표집, 지표 구성, 시각화의 기법에 어떠한 알고리즘이 구현되어 있으며, 이것은 어떤 함의를 갖는지 비판적으로 논의한다.

(1)데이터 수집 : 표집의 문제

이 글은 ‘컴퓨터 연산과학’에서 표집 및 표집오차라는 문제가 더 이상 제기될 수 없는가? 에 대해 문제를 제기한다. 첫 번째로 트위터 연구에서 흔히 사용하는 API(application programming interface)를 활용한 크롤링의 경우, 데이터 접근성에서 차이가 있다고 한다. 두 번째는 대규모 데이터가 수집되는 경우 표집을 위한 크롤링 과정에 알고리즘이 작동하며, 그 알고리즘에 따라 추출된 표본들 사이에 차이가 나타난다는 것이다. 세 번째는 이 글에서 새롭게 제기하는 표집의 또 다른 문제로서, 표본을 구성하는 요소가 무엇인가 하는 것이다. 일반적으로 빅데이터에서 표본의 구성요소는 사람이거나 트윗이나 포스트와 같은 대상이며, 표본이 대규모라 하면 사람이나 대상의 숫자가 많은 경우를 말한다. 그러나 이것은 명백한 한 가지 사실을 간과하고 잇는 것으로서, ‘시간적 표집’(temporal sampling)이 바로 그것이다. 표집의 대상이 되는 시간의 범위가 달라질 수 있다는 것은 시간이 상수(constant)였던 전통적인 방법의 경우와 달리 빅데이터 표집에서는 시간이 ‘변수’(variable)가 되는 것이다. 즉 표집의 대상이 시간의 흐름에 따라 변화한다는 점에서 표집과 그 결과인 표본은 시간 의존적이라 할 수 있다. 이것은 본질적이면서도 실제 표집 및 분석 과정에서 결정적인 문제들을 제기한다.

(2)데이터 분석 : 지표 구성의 문제

빅데이터의 분석은 두 가지 점에서 기존의 분석과 구별되는데, 하나는 데이터의 크기가 크고 그 구조가 복잡하다는 점이고, 다른 하나는 기존의 분석 기법과 달리 고도의 수학적 알고리즘이 동원되고 있는 것이다. 이 글은 두 번째 점, 즉 알고리즘에 주목한다. 분석 알고리즘에 접근하는 이 글의 핵심적 주장은, 알고리즘이 흔히 생각하듯 가치중립적인 것이 결코 아니며 사회적인 그 무엇, 특히 권력 관계에 대한 인식을 반영하고 있다는 것이다. 따라서 어떤 알고리즘을 동원하느냐에 따라 그 현상에 대한 그림은 달리 주어진다(Mackenzie, 2007). 이 글에서는 구글의 페이지랭크 알고리즘을 예로 삼아 말한다. 첫째로 지표를 개발한 구글 창업자 로렌스 페이지(Lawrence Page)의 이름을 딴 페이지랭크(Brin & Page, 1998)와 같은 지표를 흔히 “재귀적 지위 지표”(recursive status index)라 부르는데, 이는 네트워크를 구성하는 하나의 노드가 갖는 사회적 지위 또는 권력을 반영하고자 하는 것이다. 여기서 네트워크의 한 노드가 갖는 사회적 지위 또는 권력은 네트워크 이웃의 지위에 의존한다는 것을 의미한다. 사회과학 분야의 지표 구성에서 사회적 구조를 반영한다는 것은 중요한 의미를 가지며, 이런 점에서 페이지링크 알고리즘은 분석 알고리즘으로서 일단 부분적으로는 긍정적으로 평가될 수 있다. 그렇지만 이 글이 두 번째로 강조하는 것은 페이지랭크와 같은 하나의 지표가 그 세상을 보는 하나의 유일한 관점은 아니라는 점이다. 또 강조하는 것은 대안적 알고리즘이 존재한다는 것이고 페이지랭크와 같은 분석 알고리즘을 구성하는 계수 또한 선택 또는 변경의 여지가 있다는 것이다. 계수가 변하면 네트워크 전체의 그림이 바뀐다.
<그림 1> 구글의 페이지랭크 공식

1)데이터 표현 : 시각화의 문제

(3)데이터 표현 : 시각화의 문제

이 글은 빅데이터 분석과 표현에서 필수적인 요소이자 작업으로 간주되는 시각화를 둘러싸고 어떤 문제가 제기되는가에 대해 검토한다. 검토의 초점은 정보 시각화가 ‘시각적 표현의 다중성’(multiplicity of visual representation)을 구현하고 있는가 하는 점에 둔다. 이 점이 중요한 이유는 시각화에서 하나의 관점만이 강제될 경우, 다양한 가능성에도 불구하고 하나의 특정한 패턴만을 보게 하는 ‘시각의 편향’을 만들어 낼 것이며, 이런 편향은 ‘중립적 시각’을 주창하는 시각적 데이터 마이닝의 기본 전제와 대조되는 것이기 때문이다.
결론적으로 이 글은 현 시점에서 볼 때 ‘컴퓨터연산 과학’은 대안적인 패러다임 후보로 인정받을 것으로 본다. 특정 학문분야에서 국한되지 않고 공학, 자연과학, 인문학, 사회과학 등 전 학문분야에서 이런 연구 경향이 점증하고 있는 것들이 이런 판단을 뒷받침한다. 과거 실증주의의 통일과학 이념이 대체로 사회과학으로 대표되는 학문 영역에서만 추구되었다면, 빅데이터 소란은 거의 모든 학문 분야에서 벌어지고 있다는 점에서 특징적이다. 컴퓨터연산 과학이 통일과학으로 성장할지, 즉 새로운 지배적 패러다임이 될지는 미지수지만, 분명한 것은 최소한 유력한 연구 프로그램으로는 자리 잡을 것이라는 점이다.

*주제와의 연관성

이 글은 빅데이터를 여러 관심분야 중 사회과학과 가장 크게 연관 지어 그 문제점이나 빅데이터의 가치에 대해 판단하는 점에서 우리가 조사키로 한 Bigdata and Socialscience 분야와 크게 관련 있는 논문이라 생각한다. 또한 우리가 조사했던 ‘논리실증주의’와 연관되게 ‘실증주의’적 관점에서 빅데이터를 관찰하기도 한다. 사회과학적인 관점에서 빅데이터와 전통적인 방법의 차이점을 구술하고 사회과학에서 가장 중요한 요인인 사람을 빅데이터가 다룰 때, 즉 사람이 빅데이터의 대상이 되었을 때에도 객관적일 수 있는지에 관한 것 등을 다루는 등 이 논문은 빅데이터와 사회과학을 주제로 하는 논문이다.

2.The Secret History of Sabermetrics, Jack Moore, BaseballProspectus, 2013.7

세이버메트릭스의 개념은 F.C. 레인(Ferdinand Cole Lane)이라는 사람으로부터 시작된다고 볼 수 있다. 레인은 1912년부터 1938년까지 최초의 월간 야구 발행물 중 하나인 ‘베이스볼 매거진’의 편집장이였다. 레인은 또한 최초의 세이버메트리션 으로 간주되기도 한다. 1) 1915년 간행물에서 레인은 ‘왜 타율시스템이 바뀌어야 하는가’라는 제목의 기사를 썼다. 타자의 수준을 타율로서 평가하는 통계적 방법은 겉으로는 그럴싸해보인다. 타자의 목적은 안타를 만들어내는 것이고, 얼마나 자주 안타를 치는지가 타율을 말하기 때문이다. 하지만 조금만 더 자세히 보면 타자의 목표는 안타를 만드는 것이라기 보단 출루하는 것이다. 안타를 치든 볼로 나가든 누상에 나가고 주자들을 진루시키고 주자들과 자신을 홈으로 불러들여야 한다. 그렇기 때문에 모든 안타들이 같은 가치를 가지지 않는 것처럼 안타만을 통계한 타율만을 가지고 선수를 평가하거나 야구를 따질 순 없었다. 1915년도의 사람들도 이 문제점을 알고 있었지만 레인은 현실성을 걱정하진 않았다. 레인은 베이스볼 매거진을 통해 경기에 대한 팬들의 이해를 더욱 넓히는데 노력을 다했다. 레인이 세이버매트릭스의 발판을 만들었다면 피트 파머(Pete Palmer)와 빌 제임스(Bill James)는 세이버매트릭스의 첫 황금기를 열었다고 할 수 있다.(Jack Moore, 2013)
피트 파머는 원래 레이시언 (Raytheon)사의 레이더 시스템 엔지니어이다. 레이시언사는 아폴로 11호의 항로를 컴퓨터로 계산해서 자동적으로 알려주는 것에서부터 걸프전에 사용된 스커드 미사일에 이르기까지 다양한 프로젝트를 진행하였다. 파머는 근무 시간이 끝난 후 전투와 우주탐사 계산에 사용된 그 성능 좋은 컴퓨터들을 이용해서 레인이 말했던 타율 문제에 대한 해결책을 찾으려고 노력했다. 레이시언사의 컴퓨터들은 미사일 유도 시스템뿐만 아니라 야구기록의 첫 번째 데이터베이스로서의 역할도 수행한 셈이다. 결국 그러한 것들은 파머의 유명한 저서 Hidden Game of Baseball(Thorn, John, Palmer, Pete, Reuther, David, 2015)가 있게 해주었다.
빌 제임스는 세이버메트릭스의 교조로 불린다. 빌 제임스는 야구에 관한 어떤 전문적인 커리어도 가지지 않았던 시골마을의 통조림회사 창고 경비원이었다. 다만 유달리 야구기록에 관심이 많았으며 1977년 자신의 독특하고 혁신적인 야구에 관한 생각을 책으로 만들어낸다. 이 책이 야구 역사상 가장 영향력 있는 야구 통계책 중 하나라고도 할 수 있는 Baseball Abstract(Bill James, 2013)이다. 몇 년 후, 우연히 이를 접한 편집자 한 명이 이를 소개하면서 야구 판을 통째로 뒤집어 놓은 세이버메트릭스가 탄생하게 된다.
제임스와 파머가 세이버메트릭스의 첫 번째 황금기를 열었다면, 1996년은 세이버메트릭스의 두 번째 황금기의 시작점이라고 할 수 있다. 1996년에는 ‘Baseball Think Factory ’와 ‘Baseball Prospectus ’가 웹 상에 처음으로 등장했는데 이는 빌제임스의 저서 Baseball Abstract나 파머의 저서 Hidden Game of Baseball을 감명 깊게 읽은 소수의 사람들이 자신들의 생각을 토론할 수 있는 든든한 장소였다. 그 후로 10년 동안, 야구통계와 야구통계에 대한 개념은 급격한 변화를 겪게 된다. 10여 년의 시간 동안 아마추어 세이버메트리션들의 연구 결과물들은 프론트 가 선수를 평가하는 방법을 바꾸어 놓았다. 그 결과 야구 전체에서 대규모의 변화가 있었고, 그 변화의 물결은 프론트에서 클럽하우스 를 거쳐 마지막은 팬들에게까지 밀려왔다.

*주제와의 연관성

이 글은 'Baseball Prospectus'에 게재된 글로 Baseball Prospectus는 야구를 통계학적으로 분석하는 사람들이 이용하는 커뮤니티라고 볼 수 있다. 머니볼 이론의 기저가 되는 세이버메트릭스의 탄생 배경과 현재까지 어떻게 발전해왔나 또한 통계를 이용한 야구의 역사에 대해 잘 기술되있다. 앞에서 연구했던 세이버메트릭스 이론에 대해 자세히 알 수 있다.

3.빅데이터 속성이 재난대응 의사결정에 미치는 영향에 관한 연구, 한국전자거래학회지 제18권 제3호, 2013.8, 17-43 (27 pages)

모바일 인터넷의 발전, 스마트 기기의 보급 그리고 페이스북, 트위터 등과 같이 소셜미디어가 확산되면서 대규모 데이터가 생성되고, 종류도 다양해지고 있다. IDC(2011)조사에 따르면 2011년 한 해 동안 전 세계적으로 생성되어 누적된 데이터의 양은 약 1.9제타바이트로 2020년에는 약 50배가 증가한 35.2제타바이트에 이를 것으로 전망하고 있다. 빅데이터는 단순히 데이터를 수집하고 축적하는 것이 아니라 대규모 데이터 속에서 숨겨진 패턴을 찾는 것으로, 이상 현상을 감지할 수 있으며 가까운 미래를 예측할 수 있다. 이와 같은 이유로 빅데이터는 민간분야 뿐만 아니라 행정, 복지, 재난 등 공공분야에서의 활용도가 증가하고 있다. 현재 많은 학술연구에서 빅데이터를 활용함으로써 사전에 위험의 이상 현상을 인지하여 더 빠르고 정확한 의사결정을 지원할 수 있음이 입증됨에 따라 그 가치를 인정받고 있다. 빅데이터의 가치가 의사결정에 인정되면서 이를 활용하기 위한 핵심요소로 시각화가 강조되고 있으며 시각화란 인간의 인지확장을 목적으로서 의사결정을 보조하는데 사용된다. 데이터가 가지는 대량의 복잡하고 추상적인 속성은 시각화의 대상이 되는 이유로, 보다 빠르고 정확한 의사결정을 위해 시각화가 중요한 것이다. 이와 같이, 빅데이터가 가지는 속성은 빠른 상황인식을 통한 신속한 의사결정에 중요한 영향을 미칠 것이고, 시각화는 이들 사이에서 상호작용 효과가 있을 것으로 판단된다. 그러기 위해 재난관리 행정조직 인 중앙부처 및 시, 도, 군, 구의 재난 관리과 대상으로 1. 상황인식에 영향을 미치는 여러 영향 요인 중 빅데이터가 가지는 속성에 대하여 고찰하고 2. 담당자의 상황인식이 재난대응 활동의 의사결정에 어떠한 관계가 있는지를 고찰한다. 마지막으로 3. 인간의 인지 영역을 확장시킴으로써 빠른 상황인식을 통한 의사결정에 지원하는 시각화를 조절변수로 설정하여 재난관리 분야에서의 필요성과 역할을 확인해야한다.

*주제와의 연관성

이 글은 빅데이터 속성이 재난대응 의사결정에 미치는 영향에 관한 연구로써 단순히 재난대응을 하는 것이 아니라 과거 정보들을 분석하고 시각화를 하여 재난 발생 시 바로바로 대응할 수 있도록 연구 하였다. 이것은 3조가 조사한 논리실증주의와 접목시켜 보면 논리실증주의 또한 기존의 있었던 현상 들을 가지고 즉, 경험을 토대로 예측을 하였다. 이러한 점을 봤을 때 빅데이터는 논리실증주의와 유사한 점을 보이며 만약 빅데이터를 제대로 활용하지 못 한다면 과거 논리실증주의가 비판받았던 것처럼 비과학적이라는 측면에서 비판을 받을 수 있기 때문에 과거 데이터를 조금 더 체계적으로 통계 분석을 하여 정확한 분석을 보일 뿐만 아니라 나아가 시각화를 통해 데이터들을 신속하게 파악할 수 있도록 해야 된다.

4.빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향, 지능정보연구 제19권 제1호, 2013.3, 125-139 (15 pages)

정보과잉이론 (Information Overload Thoery)과 최근 빅데이터의 사회현상을 관련지어 사용자 저항에 미치는 영향(User Resistance Thoery)을 분석하였다. 최근 주목 받기 시작한 빅데이터 기술은 대량의 개인 정보에 대한 접근, 수집, 저장을 용이하게 할 뿐만 아니라 개인의 원하지 않는 민감한 정보까지 분석할 수 있게 한다. 이러한 기술이나 서비스를 이용하는 사람들은 어느 정도의 프라이버시 염려를 가지고 있으며, 이것은 해당 기술의 사용을 저해하는 요인으로 작용할 수 있다. 대표적 예로 소셜 네트워크 서비스의 경우, 다양한 이점이 존재하는 서비스이지만, 사용자들은 자신이 올린 수많은 개인 정보로 인해 오히려 프라이버시 침해 위험에 노출될 수 있다. 최근 과거에 비해 사용자들이 직접 생산하고 있는 정보의 양이 급격히 증가했기 때문에 정보 과잉의 현상이 일어나고 있다. 정보 과잉이론(Information Overload Thoery)란 정보의 양이 처리 가능한 범위를 벗어난 상태를 의미하며 초기연구는 인간 심리학에서 출발하였고, 시스템에 유입되는 정보의 양적 관점이 아니라 인간에게 제공되는 정보의 양에 따른 행태 변화를 중심으로 이루어졌다. Miller(1956)는 인간의 정보처리 역량은 입력되는 정보의 양과 선형적 관계를 가지고 있지만 그 능력에는 한계가 있다고 주장하면서, 그 한계를 넘어선 정보의 양은 오히려 정보 처리 능력을 저하시키거나 문제를 야기할 수 있다고 주장하였다. 정보 과잉에 대한 개념이 소개된 이후 사화과학, 정보과학, 마케팅 등 다양한 영역에서 적용되었고, 인지 과잉(Cognitive Overload), 커뮤니케이션 과잉, 지식과잉, 정보 피로 현상 등 다양한 이론의 기반이 되었다. 이러한 정보 과잉과 관련된 연구들은 주로 부정적 결과를 가져올 수 있는 원인으로서 정보과잉 개념을 바라보았다. 최근 소셜 미디어는 사람들의 커뮤니케이션 방법과 정보의 유통 구조의 변화를 주도한 반면 온라인상에서 개인적 정보의 양을 급격히 증가시키는 원인으로 작용하고 있다. 사람들이 홈페이지나 소셜 네트워크 서비스를 통해 자의적으로 인터넷 상에 올리는 개인적인 정보를 포함하여, 정보시스템의 사용에 따른 접속 기록이나 이용 패턴과 같은 흔적 정보들의 저장과 분석은 온라인상의 개인정보 과잉이라는 문제를 야기하고 있다. 사용자저항이론 에서 (User Resistance Thoery) 정보시스템에 대한 사용자 저항은 정보시스템 도입에 따라 사용자가 가지게 되는 부정적인 반응이나 행위로 정의 되는데 저항이라는 개념에 대한 연구는 주로 정보시스템이나 새로운 기술 도입에 따른 변화나 혁신에 대한 조직적 관점의 저항을 중심으로 연구가 진행되어 왔다. Lapointe abd Rivard(2005) 연구에 따르면, 정보 시스템 사용자들은 조직 환경이나 대상 시스템과의 상호작용을 통해 위협을 인지하게 되고, 이는 곧 사용자들의 저항행위로 이어진다고 보았다. 그리고 이러한 저항 행위는 다시금 상황 요인에 영향을 주는 순환적 관계를 가지게 된다고 보았다. 또한 나타낼 수 있는 저항 행위의 정도를 수용, 중립, 무관심, 소극적, 적극적, 공격적 저항의 6단계로 구분하면서 지각된 위협의 정도에 따라 결정된다고 보았다. 요컨대, 사용자 저항은 정보시스템 수용과는 다른 관점으로, 기존 수용 이론이 설명하지 못하는 부분을 설명해 줄 수 있다. 또한 사용자 저항이라는 개념은 예상되는 위험요소에 대한 사용자의 저항적 태도와 행위로 분리 된다. 즉, 사용자들이 자신들이 처한 환경이나 주변의 영향을 통해 저항적 태도를 가지고 있다고 해서 그것이 반드시 저항적 행위로 이어지는 것은 아니기 때문이다. 하지만 사용자들이 정보시스템과 상호작용하면서 인지하게 되는 개인정보 과잉은 사용자 저항 이론에서 제시한 지각된 위협인 프라이보시 위험과 염려에 영향을 줄 것으로 보았으며 그 결과 소셜 네트워크상의 개인정보 과잉현상은 사용자들의 프라이버시 위험 인식에 영향을 주어 개인의 프라이버시 염려 수준을 증가 시키는 요인으로 작용 할 수 있다고 보았다.

*주제와의 연관성

이 글은 빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향으로써 점점 늘어나는 데이터와 소셜 네트워크로 인해 사람들의 개인정보가 노출되고 그로인해 개인 프라이버시가 위협을 받고 있다. 3조가 조사한 논리실증주의는 과거 정보들을 지금처럼 방대한 정보를 얻어 개인정보 과잉과는 동떨어져 있지만 논리실증주의 또한 어마어마하게 넓은 사회과학에서 일어나는 사실을 추론하는 것이기 때문에 정보 과잉과 엮어 한계를 넘어선 정보의 양은 오히려 정보 처리 능력을 저하시키거나 문제를 야기할 수 있다고 주장과 부합하다고 볼 수 있다. 이러한 이유로 반증주의가 하나의 오류라도 발견하면 그 명제는 거짓이 된다며 비난을 하며 등장하게 된다.

5.미래 지식 서비스를 위한 빅데이터 처리의 기술적 요구사항, 최성곤, 오진태, 장종수

정보화 사회가 가속화 되면서 IT서비스는 일상화 되면 스마트화 되고 있다. 스마트 IT 시대에는 사물,네트워크,소셜 서비스 등의 범위 및 구성 형태와 한계 등이 모호해지게 된다. 이는 일상화된 스마트 서비스로 인해 새롭게 생성되는 수많은 데이터의 모호성을 누가 필요로 하며 언제,어디서,어떻게 처리하는 것이 가장 가치 있는 데이터가 될 수 있도록 하는 지 결정하게 된다. 생성 가능한 데이터를 어떻게 다루느냐에 따라 그 데이터의 가치가 달라질 수 있다는 것은 데이터의 가치 상승을 위해 기존의 방식과는 다른 데이터 처리 기술이 적용될 필요가 있다는 것을 의미한다. 2)
새로운 서비스의 창출은 기존의 서비스 특징과 다른 전혀 새로운 형태의 서비스 분야에 해당하며 그 기술적 요구 사항 또한 매우 다르게 진화해 나갈 것으로 판단되는 이 부분에서 빅데이터의 기본적 데이터 처리 관점에서의 기술과 새로운 미래 서비스에 대한 전망과 기술적 요구 관점에서 인프라 측면에서의 기술적 고려 사항으로 나누어 고찰해 보았고 인프라에서의 기술적 고려 사항 중 향후 도래할 미래의 지식 미디어 산업 관점에서 새롭게 등장할 서비스를 지원하기 위해 노력하고 있다

*주제와의 연관성

미래 지식 서비스를 위해 빅데이터의 정확성과 명확성을 높이기 위해서는 정확한 데이터를 갖는 것에 대해 목표를 두고 있으며 가치 있는 데이터가 될 수 있게 하려면 신뢰도를 높이는 것에 대해 노력을 해야 한다고 생각된다. 빅데이터를 이용해 기존의 방식과 다른 데이터 처리 기술을 이용하는 방법은 좋지만 논리적 실증주의 라는 정확하지 않다면 이론 성립이 불가한 이론이 적용이 된다면 이 명제는 비판을 받을 수 밖에 없다.이러한 비판을 자제하기 위해 더 많은 통계학적 데이터와 융합을 해 논리적 정보를 보여줘야 한다고 생각한다.

6.클라우드 기반 빅데이터 기술 동향과 전망(김상락,비케이엔씨,강만모,울산대학교)

클라우드는 다양한 클라이언트 디바이스에서 필요한 시점에 인터넷을 이용해 공유 풀에 있는 서버,스토리지,어플리케이션,서비스 등과 같은 IT자원에 쉽게 접근하는 것을 가능하게 하는 모델이다.
클라우드 컴퓨팅은 온디맨드 네트워크를 통해 구성 가능한 컴퓨팅 자원(네트워크, 서버, 스토리지,어플리케이션, 서비스)의 공유 풀로 접속하여 유비쿼터스를 가능하게 하는 모델이다.그것은 신속하게 프로비저닝(Provisioning)할 수 있으며 또한 서비스 제공자가 손쉽게 서비스를 해제 할 수 있다.
수많은 데이터들로부터 가치있는 정보를 얻기 위해서는 빅데이터 기술을 통한 데이터 수집 및 분석 작업이 필요한데 이 기술이 필요한 조직이나 기업에서는 프라이빗이나 퍼블릭 클라우드 서비스 방식의 시스템 도입을 검토하고 있는데 대규모의 기업이나 조직에서 많은 비용이 들어가 고급 인력이 필요하더라도 클라우드 서비스 방식의 빅데이터 시스템 도입을 원하는 것인데 그 이유는 안정적인 서비스를 확보할 수 있고 보안 측면에서도 강력하기 때문이다.
대부분의 사람들은 아직까지 이러한 빅데이터 기술이 쉽게 사용할 수 있는 것이 아닌 매우 어려운 기술로 생각하고 있다. 그 이유는 기업이나 조직이 비즈니스 활용 측면보다는 빅데이터 관련 기술에만 너무 치중하기 때문에 빅데이터 기술을 하나의 클라우드 서비스 형태로 제공받을 수 있게 된다면 기술적인 측면보다는 활용적인 측면에 더욱 더 집중할 수 있게 되는데 지금보다 다양한 분야에 빅데이터 기술이 활용될 수 있다.

*주제와의 연관성

데이터의 규모가 방대하고 다양한 종류의 정형,비정형 데이터,분석과 예측을 즉시에 해결 등의 특징을 가지는 데이터를 빅데이터라고 한다.논리적 실증주의를 통해 정확하고 명확한 데이터를 기반으로 하는 빅데이터에 대해 조건을 만족하지만 일반화를 시키는 데에 있어 비판을 받을 수도 있는 이론이다. 빅데이터의 정확한 통계적 데이터의 구현을 위해서는 논리적 실증주의의 이론이 필요하다고 생각한다.

7.빅데이터 시대에 개인화서비스와 프라이버시 패러독스의 고찰-사회기술적 관점을 중심으로, 김선경, 한국지적정보학회지 제16권 제2호, 2014.8, 193-207 (15 pages)

위 논문에서는 빅데이터는 개인화서비스로 인한 가치 효용은 높은 반면 프라이버시 염려의 비용을 갖는 패러독스 이론적 복잡성을 갖는다고 설명하고 있다. 따라서 본 논문은 그러한 복잡성을 이해하고 고찰하는 것을 목적으로 하고 있다. 이를 위해 외부환경, 내부환경 그리고 주요 이슈를 분석하는‘사회기술적 관점(Sociotechnical Perspective)’에 근거하여 고찰하였다. 그 결과 빅데이터 시대에 패러독스 이론은 사용자의 신뢰를 확보하는 것이 중요하며 신뢰확보를 위한 절차적 정당성을 갖추어야 함을 제시하고 있으며 특히 절차적 정당성을 모색하기 위해서는 지속적인 컨텍스트 접근 프래임 개발의 필요성이 있음을 설명하고 있다.

빅데이터 시대의 외부환경 분석은 개인화서비스 요구의 증대이다. 개인화서비스 요구에 대응하는데 있어서는 무엇보다 컨텍스트 빅데이터의 수요와 비용을 고려하는 것이 중요한 관건이다. 또한 내부환경 분석은 패러독스이론 문제의 대두와 이에 대한 접근이다. 컨텍스트를 고려한 개인화서비스는 거대한 기회를 창출하지만 그에 반해 기술적·사회적 비용을 야기시키는 패러독스이론을 갖는다. 특히 사용자의 프라이버시 염려가 가장 중요한 패러독스이론의 문제이고, 이러한 사회적 비용은 상쇄이론에 근거한 다양한 논의를 통해 접근해 볼 필요가 있다. 이 프레임은 사용자의 상황의존성이나 주관적 인지에 보다 초점을 두고 문제를 해결하고자 한다는 점에서 의미를 갖는다.
결론적으로 주요 이슈분석은 신뢰에 초점을 두고 이를 위한 절차적 공정성 확보 방안을 제시하고 있다. 본 논문에서 빅데이터 패러독스이론의 문제는 결국 사용자의 주관적 인지문제로서 불확실하고 위험 한 것에 대한 사용자의 인지문제를 신뢰와 연결 시켜 접근하고 있다. 나아가 신뢰를 확보하기 위 한 것으로 절차적 정당성 확보가 중요한 것이다. 이러한 논의를 통해 정부는 빅데이터의 개인화서비스를 창출해 나가는데 있어서 무엇보다 사용자의 신뢰확보를 위한 절차적 정당성 확보를 위한 지속적 노력을 하여야 할 것이다. 절차적 공정성은 각각의 컨텍스트를 어떻게 바라보고 접근하는가에 따라 실제 실행범위나 방법 등의 정책방안이 달라질 것이다. 컨텍스트는 보다 다양한 관점에서 접근·도출할 수 있으며, 이는 결과적으로 빅데이터 개인화서비스 활용의 활성화에 있어서 관건이 될 것으로 사료된다. 따라서 향후 절차적 정당성 확보를 위해서 지속적으로 컨텍스트 접근 프레임을 개발해 나가고 그에 따른 적실한 정책대안을 모색해 볼 필요가 있다.

* 주제와의 연관성(결론)

빅데이터 시대가 대두되면서 그에 따른 여러가지 사회현상들이 나타나고 있다. 그 중 가장 이슈화 되는 사회현상은 개인화 서비스와 프라이버시의 패러독스 이론을 뽑을 수 있다. 빅데이터의 사용이 급증하면서 많은 양의 데이터를 저장, 관리, 기록하는데 있어서 정보유출은 심각한 사회현상을 초래할 수 있다는 점이다. 빅데이터는 과거의 데이터를 한 곳에 모아 대용량의 대이터를 통해 우리 사회를 예측하고 분석하는 만큼 개인화서비스와 프라이버시에 있어서 그에 대한 활용과 활성화에 대한 보안을 지속해서 확장시킬 필요가 있다고 본다.

8.빅데이터의 이해와 도서관 정보서비스에의 활용: 이정미 한국비블리아학회지 제24권 제4호, 2013.12, 53-73 (21 pages)

위 논문은 빅데이터 시대의 도래와 함께 다양한 분야에서 연구의 초점이 되고 있는 빅데이터를 재 조명한것이다. 빅데이터의 개념, 제기되는 중요한 이슈, 도서관 정보서비스에의 활용이라는 세 가지 연구문제를 각종 문헌과 사례를 검토하여 밝히고자 하였다. 연구결과 빅데이터의 개념은 현실사회의 맥락에서 분석, 가치가 부가되어야 그 의미가 있음을 밝혀냈으며, 데이터의 정확성이나 신뢰성에 대한 문제, 개인정보보호, 보완, 윤리적 이슈, 지적재산권 등 다양한 이슈가 빅데이터 연구와 연관되어 제시됨을 알 수 있었다. 또한 이러한 이슈에 대한 문제제기를 이해한 가운데 빅데이터는 도서관 정보서비스에 활용될 수 있다고 판단했는데 도서관의 비전과 전략 수립에 도입하거나 지역사회를 지원하고 맞춤형 정보서비스를 제공하기 위한 근거를 제시하는 등 효과적으로 활용될 수 있다고 결론지었다.
인터넷의 대중화와 정보기술의 혁신적 발달 및 모바일 기기의 급속한 보급은 언제 어디서나 네트워크에 접속할 수 있고 이로 인해 사람들이 좀 더 쉽게 정보처리가 가능한 환경을 제공하고 있다. 정보 기술의 활용이 당연해 지면서 각종 SNS(Social Network Service 이하 SNS)의 활용과 동시에 사람들은 단순히 SNS를 거쳐가는 것이 아니라 SNS를 통해 수집된 정보를 이용해 자신만의 정보를 재생산하고 타인에게 전달하는 과정을 자연스럽게 행하고 있다 .이와 같은 정보기술의 발전과 이용확산은 언제부턴가 데이터의 양적 팽창을 가져왔으며 더불어 거시적 입장에서 데이터의 흐름을 주시할 필요성이 여러 분야에서 제기되었다. SNS 사용자들은 자신의 일상적 사회 활동을 하며 스마트 폰 과 SNS을 통해 다른 사람들과 소통하고 정보를 교환하는 등의 다양한 상호작용을 함으로써 오프라인의 생활과 온라인에서의 소통이 결합된 삶의 패러다임을 영위하고 있다. 이러한 패러다임의 변화는 초기에는 단순한 소통 미디어였던 소셜미디어를 정보기술의 중심 주제이며 대상으로 올려놓았으며 당연히 소셜미디어는 정보기술과 사회를 이야기할 때 화
제의 중심에 있다. 소셜미디어 기반 데이터는 기존에 우리가 접할 수 있었던 데이터보다 훨씬 방대하고 다양한 구조를 가지고 있다. 또한 사용자들 사이에서 직접적인 상호 소통을 통해 생성되고 공유되며 교환되는 형태를 띠고 있기 때문에 상호작용이 일어나는 바로 그 시점에서의 사회 모습이나 사람들의 행동 양식을 나타내고, 반영하고 있다고 볼 수 있다.

*주제와의 연관성

위 글은 빅데이터 시대의 도래와 함께 다양한 분야에서 연구의 초점이 되고 있는 빅데이터를 재 조명함으로써 소셜네트워크서비스(SNS), 도서관 정보서비스 등 다양한 사회현상에서의 빅데이터의 활용과 그 가치를 파악하는데 있다. 사회과학 적인 관점에서의 빅데이터의 가치를 판단하고 논리실증주의적 관점에서 빅데이터를 관찰함 으로써 빅데이터 안에서 우리가 하루 동안 쏟아내는 데이터의 양을 얼마더 효율적이고 더 가치있게 활용할 수 있을지를 연구 할수있다.

3차 과제

=논리실증주의의 과학철학과 새로운 과학철학=

본문

1. ‘논리실증주의의 과학철학과 새로운 과학철학’

이 책 ‘논리실증주의의 과학철학과 새로운 과학철학(신중섭, 1977)’은 Harold I. Brown의 Perception, Theory and Commitment : The New Philosophy of Science(The University of Chicago Press, 1977)의 완역본이다. 옮긴이는 ‘commitment’에 대한 적절한 우리말을 찾지 못해 원제목을 살리지 못하였다고 한다. 하지만 원제에 논리실증주의란 말이 없다고 해서 이 책이 논리실증주의를 주로 다루지 않는 것은 아니다. 이 책은 두 가지 목적을 가지는데 그 첫 번째 목적은 새로운 과학철학의 주요 주제를 개관하고, 그것들을 좀 더 자세히 검토하면서, 이 새로운 접근이 제기한 문제들 가운데 일부를 해결하는 것이다. 두 번째 목적은 전제들이 연구를 통제한다고 보는 입장은 과학뿐만 아니라 과학철학에도 똑같이 적용될 수 있다는 주장을 전개하는 것이다. 저자는 논리경험주의도 이러한 종류의 탐구 방식이라는 것과 새로운 과학 철학의 전개도 과학 혁명과 동일한 종류의 지적 혁명이라는 것을 보여준다.
이 책은 크게 1부와 2부로 구성되어있는데 대체로 1부와 2부가 독립된 하나의 체계를 이루고 있다. 1부에서는 논리실증주의를 다루고 2부에서는 새로운 과학 철학의 중심적인 주제들을 다룬다. 우리는 우리가 조사하는 분야인 논리실증주의를 다루는 1부에 대해서만 조사키로 하였다.

2. 논리 실증주의의 기원

흄(David Hume)의 고전적 경험주의를 출발점으로 삼아 현대의 기호 논리학의 발전과 논리 실증주의자들의 영향으로 이 경험론이 어떻게 변형되는가를 살펴본다. 논리 경험주의자는 흄의 저작에서 유래하는 고전적인 형식에 초점을 맞추어 문제에 접근하고 있다.
흄의 입장은 인상, 관념, 언어라고 하는 세가지 구분에 의해 명료하게 밝혀질 수 있다. 흄의 ‘인성론’의 첫째 권은 “마음속의 모든 지각은 두 가지 구별되는 요소로 분석되는데, 나는 그것들을 인상과 관념이라고 부르겠다” 1라는 글로 시작된다. 인상은 ‘우리들이 지각하거나 내성할 때 경험하게 되는 직접적인 앎’이며 관념은 ‘지각이나 내성이 아닌 반성이나 기억이나 상상 등과 같은 모든 심적인 활동을 통해서 알게 되는 것’이라고 정의 한다. 관념에는 ‘단순관념’과 ‘복합관념’이 있다. ‘단순관념’은 인상이 일어난 후에 마음 속에 남게 된 인상의 사본이라고 할 수 있는데 인상보다 덜 강력하고 덜 생생하다. ‘복합관념’은 상상력이 ‘단순관념’들을 결합함으로써 생긴 관념이다. 상상력은 단순관념을 결합하여 복합관념을 형성은하지만 새로운 단순관념을 만들지는 못한다. 따라서 한 사람이 가질 수 있는 관념은 그 사람이 경험한 인상에 의해 제한된다. 흄에 의하면, 인상과 관념은 아는 것의 목록일 뿐 지식을 구성하지는 못한다. 모든 지식은 명제로 표현되며, 오직 명사에 해당하는 관념이 존재할 때에만 명사는 의미를 가진다. 개인은 특정 명사에 해당하는 관념을 형성하기 위해 필요한 인상을 경험했을 때에만 그 명사의 의미를 알 수 있다. 따라서 경험할 수 없는 대상을 지칭하는 명사는 모두 무의미한 소리이다. 따라서 유의미한 영역은 경험 가능한 영역으로 제한된다.
흄에 의하면 인상이 의미와 진리의 근원이며, 궁극적 존재이고, 실재를 구성하는 근본요소이다. 우리들이 아는 세계는 오직 인상의 세계이며, 모든 인상은 다른 인상과 구별된다. 곧 어떤 인상의 존재 유무는 다른 인상의 그것과는 전혀 별개의 것이다. 이와 같은 흄의 주장은 경험된 세계의 지식의 본질에 관해서 중요한 문제를 제기한다. 내가 일련의 인상, 예를 들어 특유한 색, 냄새, 모양 등이 항상 함께 일어나는 것을 관찰했다고 가정해보자. 우리가 “불”이라고 하는 것은 언제나 적당한 거리에서의 '열'의 인상을 수반한다. 흄에 따르면 열의 인상과 그 밖의 다른 인상들 사이에는 어떤 관계도 존재하지 않는다. 따라서 우리는 이러한 인상들이 미래에도 함께 일어나게 될 것이라는 점을 논리적으로 정당성을 갖고 주장할 수 없게 된다. 모든 일반적인 명제는 미래의 ‘인상’에 대한 예측을 포함한다. 그러나 과거에 함께 일어난 인상들 사이에 관련이 없다고 한다면, 미래에도 그러한 인상들이 함께 일어날 것이라는 보장을 할 수 없다. 우리들은 일상생활에서도 유사한 문제를 찾아볼 수 있다. 우리들의 일상사는 과거의 경험과 미래의 경험이 동일할 것이라는 가정 위에서 계속되기 때문이다.
논리주의자의 기본 정립은 “모든 순수 수학은 몇 개의 기본적인 논리적 개념으로 정의될 수 잇는 개념만을 다룬다. 그리고 순수 수학의 모든 명제들은 몇 개의 기본적인 논리적 원리로부터 이끌어 내어진다.”2이다. 화이트헤드와 러셀은 이 정립을 완벽하게 증명하려고 했다. 그리고 그들의 논의를 전개시키기 위해서 매우 새로운 논리 형식을 발전시켰다. 이 논리가 바로 프린키피아 논리학이다.
프린키피아 논리학은 논리경험주의자들에게 중요한 영향을 미쳤는데 논리실증주의자들은 프린키피아 논리학의 논리를 과학분석의 제일 중요한 개념적 무기로 사용했다. 프린키피아 논리학의 중요한 특징은 그것이 외연 논리(extensional logic)라는 것이다. 외연 논리에 대해 설명해보자면, “요소”명제와 “분자”명제가 있는데 이 둘은 구분되며, 결합사에 의해 요소 명제가 연결되어 분자 명제를 이룬다. 요소 명제는 참 아니면 거짓이며, 명제 결합사는 너무 한정되어 있기 때문에 분자 명제의 진리치(참인지 아닌지)는 그것을 구성하는 요소 명제의 진리치에 의해서만 결정된다. 분자 명제의 진리치를 결정할 때 그것을 구성하는 요소 명제의 참인지 아닌지를 제외한 의미나 내용은 아무런 역할도 하지 못한다. 따라서 어떤 공통된 대상을 지칭하지 않는 두 명제의 결합 사이에는 어떤 의미 있는 차이점도 존재하지 않는다.
이러한 명제들의 관계는 “실질적 함축“(material implication)3”이라 정의할 수 있는데 실질적 함축은 수학적 추론의 분석을 위해서는 아주 적절한 개념이다. 그런데 논리 경험주의자들은 프린키피아의 형식론을 순수 수학의 한계를 넘어 확장하여 사용했다. 논리주의에 의하면 수학은 논리학이며, 따라서 논리학이 참이 되는 방법과 동일한 방법으로 수학도 참이 된다.
논리경험주의자들은 비트겐슈타인(L. Wittgenstein)의 “항진 명제”의 정의를 그 자신들의 표준으로 삼았다. 다양한 명제 형식에 대한 완전한 진리표가 구성될 때 이들은 세가지 유형으로 나누어진다. ‘독립 변수의 어떤 값에 대해서는 참이고 그 나머지에 대해서는 거짓이 되는 유형’, ‘독립변수의 모든 값에 대해 거짓이 되는 유형’, ‘독립 변수의 모든 값에 대해 참이 되는 유형’으로 구분된다. 비트겐 슈타인이 “항진 명제”라 하는 것은 세 번째 유형이며, 논리주의자에 따르면 모든 논리적 진리나 수학적 진리는 모두 항진 명제에 포함된다. 모든 논리적 진리는 항진 명제이다라는 정립은 “모든 세계에서 참” 혹은 “형식 자체 만에 의한 참”과 같은 논리적 진리에 대한 전통적인 정의뿐만 아니라 경험주의의 요구와도 분명히 일치한다. 항진 명제는 세계에 대해서 아무 것도 말하지 않으며 그것은 다만 기호와 그 기호의 사용에 대해서 말할 뿐이다. 따라서 경험주의자들도 항진 명제가 참이라는 사실은 아무 이의 없이 받아들인다.
콩트(A. Comte)가 처음으로 사용한 “실증주의”란 말은 일반적으로 엄밀한 경험주의를 지칭하는 개념으로 사용된다. 실증주의자들은 직접적인 경험에 근거한 주장을 담고 있는 지식만이 참된 지식이라고 단언한다. 현대의 논리실증주의, 특히 비엔나 학파의 실증주의는 분석의 주요한 도구로서 수학원리에서 전개된 기호 논리학의 체계를 받아들이고 있다.

3.‘확증’ 헴펠의 패러독스

논리 경험주의자의 과학 철학의 중심적인 문제 중 한가지는 과학법칙과 그것을 확증하거나 확증하지 않는 관찰 언명4 사이에 존재하는 확증의 관계에 대한 분석이다. 이 문단에서는 확증의 문제를 고찰함으로써 논리경험주의자의 과학 철학을 검토해 보기로 한다. 확증의 문제는 양의 문제 혹은 질의 문제로 파악될 수 있다. 확증에 대한 양적인 이론은 관찰 증거를 근거로 가설에 대한 확증의 수적인 정도에 집중한다. 반면 확증에 대한 질적인 분석은 가설과 그 가설을 확증하는 관찰 보고 사이에 존재하는 관계를 설명하는 문제에 관심을 기울인다. 우리가 가설과 증거 사이의 관계를 계량화하기 전에 어떤 사례가 가설을 확증하는 관계 또는 그렇지 않은 관계에 있는지를 알 수 있어야 하기 때문에 두 번째 문제에 대해 논리적으로 선행한다.
1) 우리들의 논의는 질적인 문제에만 국한 될 것이다.
2) 대안으로 우리는 확증의 계산으로 해석할 수 있는 추상적 계산법을 구성할 수도 있다. 그러나 일련의 언명들과 관련하여 이러한 해석을 하기 위해서는 우리는 이미 이러한 언명들을 가설과 확증 사례의 언명 혹은 반증 사례의 언명으로 분류해야 할 필요성이 있다.
헴펠의 패러독스란 “모든 까마귀는 검다”라는 가설이 “하얀 신발”에 의해 확증 된다 것이 우리의 직관을 흔드는 그러한 주장이다. 이 패러독스는 두 가지 원리에 기반을 둔다. 첫 번째는 니코 조건(Nicod condition)이고 두 번째는 동치 조건(equivalent condition)이다. 니코 조건에 따르면 “모든 까마귀는 검다”라는 가설은 “검은 까마귀”에 의해 확증된다. 그리고 동치 조건에 따르면, “모든 까마귀는 검다”는 “검지 않은 것은 까마귀가 아니다”와 동치인데(대우명제) 이 명제는 “검지 않고 까마귀가 아닌 것”에 의해 확증된다. 결과적으로 “검지 않고, 까마귀가 아닌 것” 예를 들어 “하얀 신발”이 “검지 않은 것은 까마귀가 아니다”라는 명제를 확증해주고 동시에 이에 대한 대우명제인 “모든 까마귀는 검다”라는 가설을 확증해 준다.
동치 조건이 거짓 원리라고 한다면 이 원리를 전제로 펼쳐진 헴펠의 패러독스도 자연스럽게 거짓이 된다. 하지만 헴펠의 패러독스는 새로운 맥락에서 재 발생하게 된다. 헴펠의 패러독스는 가능한 반례가 제거됨으로써 가설의 참 가능성이 높아진다는 의미에서 참인 주장이 된다.

1). 기호법

“p & q”는 “p”와 “q”가 모두 참인 경우에만 참이고 나머지 경우에는 거짓이다. “p → q”는 “p”가 참이고 “q”가 거짓일 경우에만 거짓이고 나머지 경우는 모두 참이다. “p → q”, “-pvq”, 그리고 “-(p&-q)”는 동치이다. 두 기호에 대한 이런 진리함수적 정의 이외에 이 두 기호 각각은 다음과 같은 방식으로 정의된다. ‘&’는 시/공간적 인접성을 표현하고 ‘→’는 필연적 연결(인과관계)을 표현한다.
‘&’와 ‘→’를 이렇게 정의하는 것은 헴펠의 패러독스를 다루는데 있어 유용한 도구를 제공한다. 그 이유는 두 기호에 헴펠의 패러독스가 암묵적으로 전제하고 있는 귀납적 일반화가 어떤 방식으로 이루어지는지를 잘 보여주기 때문이다.
귀납적 일반화는 과학의 영역에서 이루어지는 논증 중 하나로서 사용되는 기호 ‘&’와 ‘→’는 통상적인 진리함수적 의미 이외에 다른 의미, 즉 위에서 정의했던 대로 시/공간적 인접성과 인과관계를 표현한다. 우리가 위의 두 기호를 이런 방식으로 정의하지 않는다면 우리는 귀납적 일반화의 본성과 인과관계의 본성을 제대로 이해할 수 없을 것이다. 헴펠의 패러독스가 이러한 귀납적 일반화 과정을 전제하고 있으므로 위 두 기호에 대한 이러한 새로운 정의는 헴펠의 패러독스를 분석하는데 꼭 필요하다.

2. 귀납적 일반화

우연히 동시에 발생하는 사건들3), 필연적 연결4)같은 것은 없는 것이다. 경험론자인 흄은 반대 할수 밖에 없다. 그 이유는 필연적 연결은 경험되지 않기 때문이다. 하지만 우리는 인과관계에 놓인 두 사건 사이에 뭔가 이 둘을 필연적으로 연결시켜주는 그 무언가가 있다고 믿는다. 따라서 흄의 이러한 주장은 정당화가 필요하다.

3. 패러독스의 원인

우리의 직관에 따르면 “모든 까마귀는 검다”라는 가설은 하얀 신발에 의해 확증 받을 수 없다. 하지만 헴펠은 우리의 직관이 잘못되었다고 주장하면서 하얀 신발이 까마귀 가설을 확증해 준다고 주장한다. 우리 직관이 어디에 근거하고 있는지 그리고 헴펠의 주장이 왜 잘못되었는지 파악해 보려면 두 가지 종류의 무한을 구분할 것이다. 첫째는 객관적 무한이고 둘째는 주관적 무한이다. 우리가 사물들의 수를 다 셀 수 없을 때 사물들의 수는 객관적으로 무한하다. 하지만 우리가 사물들의 수를 다 셀 수 있다는 확신을 가질 수 없을 때 사물들의 수는 주관적으로 무한하다. 객관적 무한의 예로서 별들의 수를 들 수 있다. 우리는 별들의 수를 다 셀 수 없다. 주관적 무한의 예로서 캘리포니아 해변 모래알의 수를 들 수 있다. 이것은 객관적으로는 유한하지만 우리는 이것을 다 셀 수 있다는 확신을 가지고 있지 않다. 지구는 객관적으로 유한한 대상들로 이루어져 있다. 그러나 우리는 그 수를 다 셀 수 있다는 확신을 가질 수 없다. 따라서 지구 내 대상들의 수는 주관적으로 무한하다.
우리의 관찰 행위는 시/공간의 좁은 영역에 제약되어 있다. 따라서 우리는 언제 관찰 행위가 끝날지 확신할 수 없다. 예를 들어 각 대상의 종과 색을 정확하고도 빠르게 판독할 수 있는 기계가 발명되었다고 가정하고 지구 내 모든 대상의 종과 색을 판독하는데 하루가 걸린다고 가정해보자. 어느 날 과학자들은 까마귀 가설과 관련해 조사를 시작한다. 반례의 수가 극단적으로 줄어드는 것을 보여지게 되면 가설이 참이 될 가능성이 점점 높아짐을 보여준다. 그리고 가설이 참이 될 가능성이 점점 높아짐을 보여주는 과정이 바로 가설의 확증 과정과 동일한 것이다. 대상들의 수를 다 셀 수 있다고 확신하는 경우 깃발의 발견은 가설을 확증해 준다. 이 경우 헴펠은 옳다. 하지만 대상들의 수를 다 셀 수 있다고 확신할 수 없는 경우 깃발의 발견은 가능한 반례를 줄여주지 못하기 때문에 가설이 참이 될 가능성이 점점 높아짐을 보여주지 못하고 결국 가설을 확증해주지 못한다. 상황이 이렇게 되어 있는 한 우리의 직관은 옳은 것이며 바로 이 점에서 헴펠은 잘못된 것이다.

4. 이론적 용어

이 문단에서는 논리실증주의의 이론적 용어에 대해 주로 다룬다.

1)경험론

전통적인 경험론은 용어들이 “감각소여”와 서로 관계를 맺음으로써 의미를 갖는다는 주장으로 흄의 감각소여라는 개념을 도입하여 필자는 흄의 분석에 포함되어 있는 내관 심리학이라는 개념의 의미에 대한 고찰을 제외하였다. 이러한 점은 현대적 경험주의와 완전히 일치한다. 경험론에 주장에 따르면 궁극적으로 일련의 감각소여에 의해 정의될 수 없는 개념은 의미가 없다. 이에 대해 러셀은 “어디에서든지 논지적 구성물은 추론된 존재자에 의해 대체될 수 있다”라는 엄격한 경험주의적인 정식화를 제시하였다. 예를 들어 “전자”나 “상태 함수”같이 관찰할 수 없는 존재자를 지시하는 용어로 가득 차 있는 철학자라면 모두 탐구해야 할 문제에 봉착하게 되는데 이 때 경험주의자의 이론을 채택하는 철학자들이 이러한 용어들이 관찰 가능한 것에 의해 정의되어야 하는지를 의문을 갖게 되었다. 러셀은 이에 대해 추론된 존재자를 유명론적으로 다루는 일련의 명제가 주어진다면 이 명제를 참으로 만들기 위해 가정적 존재자를 갖춰야 할 성질을 관찰하고 필요한 성질을 가지고 있는 덜 가설적인 존재자의 논리적인 함수를 구성하여 추론된 존재자를 대체하여 의심의 여지가 없는 해석을 얻자는 주장이다.
예를 들자면 회로의 일부인 전류계 바늘이 휘어지는 현상은 회로로 흐르는 전자의 흐름의 통과 때문에 생긴 현상인데 여기서 전자는 추론된 존재자로 관찰 데이터를 토대로 추론할 뿐 실제로 지각을 하지는 못한다. 전자를 지각할 수 없기 때문에 러셀에 있어 전자라는 용어의 의미를 무엇으로 규정해야 할지는 문제가 남게 된다. 이에 대한 해결로는 추론된 존재자라는 개념을 제거함으로써 문제해결이 가능한데 ‘전자’라는 용어가 들어있는 참인 명제를 검증하기 위해 필요한 모든 종류의 관찰 연명을 고찰하는 대신 기호 논리학의 기법을 응용하여 이러한 관찰 연명에 적절한 논리적 함수를 구성해 이 논리적 함수를 “전자”에 대한 정의로 생각하자는 것이다.

2)논리경험주의자의 반론 2가지

논리경험주의자들은 위에 대한 반대로 2가지의 반론을 제시하였다. 첫 번째로는 이론적인 개념들이 경험론적으로 제시된다면 그러한 개념을 포함하고 있는 이론들은 과학이론의 가장 중요한 기능 중 하나를 상실한다는 것이다. 이 주장은 램지5가 처음 주장하여 브라드와트6가 발전시켰다. 논리경험주의자의 주장으로는 일반적으로 현대의 경험주의자들은 성공적인 과학 이론의 특징으로 그 이론을 근거로 새로운 현상을 예측할 수 있는 사실과 특정현상 영역을 설명하기 위해 제안된 이론을 사용하여 그 이론이 처음 구성될 단계에서 고려되지 않았던 다른 현상을 설명한다는 사실을 가지고 있다는 것이다. 예를 들어 맥스웰(J.Maxwell)은 기체 분자이론을 통해 기체확산법칙에 대한 설명 제시를 하였는데 실제 어떤 현상을 설명하기 위해 가정된 이론이 그 밖의 다른 현상을 설명할 수 없을 때 그 이론은 과학적으로 성취가 인정이 안 된다. 그러나 새로운 자료를 설명할 때마다 이 자료를 우리가 사용하는 용어로 정의 내리고 기존 개념에 새로운 영역의 경험을 포섭시키는 것이 아니라 이론적 개념들을 다시 정의하는 것이 과학 이론이 실제로 전개되는 방식과 일치하지 않아 러셀의 설명방식에 따른다면 확정될 수 있는 이론이 있을 수 없다는 것이다.
두 번째로는 이론적 용어를 명시적으로 정의해야 한다는 주장의 경향어7에 대한 카르납의 논의에서 나타났다. 논리경험주의자의 전제가 그들의 과학철학에서 맡고 있는 역할이 무엇인가를 고찰하는 우리는 두 가지 점을 지적해야 한다. 첫 번째로는 전형적인 논리 경험주의자의 양식에서 논리 경험주의자들이 그들의 과학 철학의 전개 과정에서 카르납의 논의는 과학에서 이끌어 낸 실제로 이론적인 용어들을 다루기보다는 일상의 경험에서 이끌어 낸 상대적으로 단순한 개념을 다루며 프린키피아 논리학에서 사용하는 기호를 사용하여 간단하게 전개될 수 있는 정식화를 다루고 있다는 것이다. 두 번째 사실은 경향어의 명시적 정의를 제안하는 과정에서 카르납이 찾아낸 난점으로 이 난점은 과학적 명제들을 형식화하는 적절한 도구로 실질적 함축이라는 프린키피아의 개념을 카르납이 받음으르서 나타나게 되었다. 왜냐하면 함축에 대한 이러한 분석의 특성 중의 하나는 그것이 역설적인 결과를 초래하기 때문이다. 거짓인 말을 갖는 가언적인 명제는 모두 참이라 하는 패러독스로 이것을 흔히 “실질적 함축의 패러독스”라고 부르며 카르납이 지적한 난점의 원인이다. 오직 관찰 가능한 것에 의해 정의될 수 있는 용어만이 인식론적인 의미를 갖는다는 주장은 경험론의 테제이다. 이러한 맥락에서 관찰 가능한 것에 의해 경향어를 정의하려는 시도가 나타나게 되었고 논리 경험주의자들은 이러한 개념 정의는 프린키피아 논리학의 기호 법에 의해 형식화되어야 한다고 주장한다.

3)크레이그의 정리

현재 많은 경험주의자들에 있어 과학의 유일한 기능은 관찰 언명들 사이에 존재하는 관계를 찾아내는 것인데 이론적 언명들은 이러한 과정에서 오직 매개자 구실을 할 뿐이다 따라서 이론적 용어들을 사용하지 않고 관찰 가능한 것들 사이의 모든 관계를 정식화 시킬 수 있는 방법을 찾아 낸다면 이론적 용어들이 불필요해지고 경험적 의미를 분석하는 문제는 제거될 것이다. 이러한 목적을 달성하기 위해 논의된 시도 중 하나가 크레이그의 정리이다. 이 정리는 형식화된 체계에서 그 체계의 내용을 바꾸지 않고 일군의 선택된 용어들을 제거할 수 있는 일반적인 방법을 제공해 준다.
이 방법을 적용하기 위한 첫 번째 필요한 것은 “본질적”표현과 “보조적”인 표현을 구별해 낼 수 있는 효과적인 기준을 가지고 있어야 한다는 것이다. 그 체계의 “내용”을 본질적인 표현의 집합과 동일하다고 간주하고 크레이그는 모든 본질적인 표현은 모두 포함하면서도 보조적인 표현은 하나도 포함하지 않는 공리화된 새로운 체계를 구성하는 방법을 제시하고 있다. 과학 철학의 관점에서 볼 때 크레이그의 방법의 중요한 결함은 오직 완결된 연역 체계(우리가 이끌어 낼 수 있는 모든 귀결)들을 이미 이끌어 낸 연역 체계에만 적용될 수 있다는 하는 점이다. 이러한 완결된 일람표를 가지기만 한다면 크레이그의 방법은 공리들 가운데에서 모든 귀결을 포함하고 있는 무한하고 아주 풍부한 공리의 집합을 구성할 수 있도록 해준다. 이것을 이론적 언명과 관찰적 언명 사이의 관계에 적용하게 되면, 이 정리는 우리가 공리화 된 이론의 도움으로 이끌어 낼 수 있는 모든 관찰적 기결들을 일단 이끌어 내기만 하면 우리들은 사실상 그 이론을 버리고 이러한 관찰 언명 모두를 새로운 연역 체계를 위한 공리로 간주할 수 있음을 말해준다.

5. 포퍼와 반증주의

이 문단에서는 반증주의자 포퍼의 논리실증주의에 대한 반박과 이론에 대해 살펴본다.

1)반증주의란?

반증주의 대표 학자 칼 포퍼(K.R. Popper)는 “귀납적인 보편적 일반화가 궁극적으로 검증될 수 없으며, 새롭고 잠재적으로 반박하는 증거는 항상 존재할 가능성이 있으므로, 단 하나의 그렇지 않은 증거도 가설을 반박할 수 있다”라는 사상에 기초해서 고안한 방법론적 입장이다. 즉, 우리는 과학 이론을 그 이론에서 연역해 낸 귀결(consequence)로 테스트하여, 단 하나의 거짓 귀결이 나오기만 하면 그 이론을 받아들이지 않는다는 이론이다. 그러나 포퍼의 과학관에 대해서는 이같이 일반적인 해석과 함께 또 다른 두 번째 해석이 있다. 이 해석은 논리 경험주의와 여러 가지 점에서 뚜렷하게 차이점을 드러내고 있으며, 다음에 논의하게 될 새로운 과학 철학과 많은 유사성을 지니고 있다.

2-1) 포퍼의 과학관에 대한 일반적인 해석

포퍼는 과학 철학의 중심 문제를 “구획(demarcation)“의 문제라고 생각한다. 구획의 문제 형이상학이나 사이비 과학으로부터 과학 이론을 구별해 낼 수 있는 기준을 찾아내는 문제이다. 겉으로 보기엔 이러한 태도는 실증주의자들의 출발점과 본질적으로 동일한 것처럼 보인다. 그러나 포퍼의 구획 기준은 의미의 기준이 아니며, 형이상학이 무의미하지도 않다. 포퍼는 의미의 문제를 중요한 문제로 보지 않으며, 구획 기준을 탐구하는 과정에서 의미 있는 논의의 한 영역, 즉 과학의 경계를 정하려고 할 뿐이다. 포퍼가 실증주의자들의 저작에서 찾아낸 구획의 기준은 “검증”의 기준으로, 이 검증의 기준에 따르면 과학 명제의 뚜렷한 특징은 그 명제들이 경험에 의해 확증될 수 있다고 하는 것이다.

2-2) 포퍼의 또 다른 두 번째 해석 [기초언명8에 대한 재확립]

포퍼는 기초 언명에 대해 “기초언명은 검정언명이므로 과학적인 가설을 붕괴 시킬 수도 있는 것이다.” 라고 언급하였다. 즉, 포퍼의 과학관에 대한 두 번째 해석에 접근하는 가장 좋은 방법은 기초 언명(basic statement)의 인식론적인 지위와 그것이 반증의 과정에서 맡고 있는 역할이 무엇인가를 재검토 해보는 일이라고 하였다. 포퍼의 기초 언명에 대한 생각을 간단히 요약을 해보면 다음 3가지로 요약할 수 있다.
(1)경험이 언명을 증명하거나 반증하는 것은 논리적으로 불가능하다.
(2)논리적 관계는 오직 언명과 언명 사이에만 적용될 수 있음을 잊지 말아야 한다.
(3)경험은 언명이 아니고 심리적 사건이며 언명과 심리적 사건 사이에는 논리적 관계가 맺어질 수 없다.
3) 포퍼의 실증주의에 대한 반박
실증주의자들의 검증의 이론은 크게 두 가지 주장으로 나누어진다. 비트겐슈타인과 슐리크(M. Schlick)가 내세운 실증주의의 초기 주장은 과학적인 명제에 대해 완전 검증이 가능하다는 입장을 취한다. 카르납(R. Carnap), 헴펠(C.G. Hempel), 라이헨바하(H. Reichen-bach)가 취한 후기의 입장은 경험이 과학적인 명제를 개연적인 것으로 보여줄 수 있다는 의미에서, 경험은 과학적인 명제를 확증할 수 있다는 입장을 갖는다. 포퍼는 이러한 두 가지 형태의 검증주의를 모두 받아들이지 않을 뿐만 아니라 귀납 논리를 구성하려고 하는 어떠한 노력도 인정하지 않는다는 것이다. 그는 전통적인 관점에서 귀납 논리에 반대하였다. 포퍼는 전제가 참이면 결론이 필연적으로 참이 되는 연역 논리만을 “논리”로 여기기 때문에, 포퍼에 따르면 귀납 추리는 논리적 추리의 범주에 들어오지 못하게 된다. 만일 귀납적인 논증을 귀납의 경험적 원리를 이용하는 것으로 해석한다면, 이 원리 자체의 타당성이 먼저 정당화되어야 한다. 그리고 모든 경험주의자들과 같이 귀납이 선험적으로 정당화된 논증이라는 입장을 취하지 않는다면, 우리는 귀납의 원리를 귀납적으로 정당화해야만 한다. 나아가 귀납주의자의 입장을 변형시켜, 귀납은 다만 결론이 개연적임을 보여줄 뿐이다라고 주장하는 것도 이와 동일한 반론에 직면하게 된다. 이러한 시도는 새롭게 변형된 귀남의 원리를 필요로 하며, 그 귀납의 원리 자체도 정당화 되여야만 한다. 포퍼는 과학적인 명제가 검증될 수 있거나 확률치를 가진다는 주장을 전면적으로 부정하면서, 연역 논리만으로 과학적인 명제를 평가할 수 있는 과학의 논리를 재구성 하려고 한다. 포퍼의 주장에 따르면 어떠한 이론이 관측을 하여 거짓으로 밝혀지면 이론을 검증하거나 증명하는 것은 아니며 더구나 그것에 확률적인 진리 값을 부여하는 것도 아니다. 이러한 관측은 “확인 corroboration”만 부여 할 수 있다고 주장하였다. 거짓으로 밝혀진 이상 이론은 포기 되여야만 하지만 이론은 여전히 과학적 이론으로 남게 된다 라고 주장 하였다.

4차 과제

1.The End of Theory : The Data Deluge Makes the Scientific Method Obsolete, Chris Anderson, Wired Magazine, 2008.06.23

이 글은 Wired Magazine의 편집장인 Chris Anderson이 와이어드지에 게재한 글이다. 크리스 앤더슨은 Science지와 Nature 지의 에디터를 역임했고, 현재 와이어드지의 편집장을 맡고 있다. 주목할만한 베스트셀러를 3권이나 내놓았으며, 세계적인 영향력을 가진 작가이다. 2008년에 그가 게재한 이 글은 전 세계적으로 화두가 되었었다. 앤더슨은 커다란 데이터, 즉 빅데이터를 페타바이트 시대라고 표현한다. 과거에 뉴턴법칙을 도출해냈던 것처럼 가설을 세우고, 모델링을 하는 등의 가설을 검증하는 식의 과학은 이제는 오래된 구식 방법이라고 얘기한다. 이제 페타바이트 시대에는 Causation(인과관계)을 Correlation(상관관계)이 대체할 것이고 과학은 일관된 모델들이나 통합된 이론이 없어도 발전할 것이라고 말한다. 이론보다 데이터가 중요하고, 데이터간의 상관관계만 찾으면 지금 시대에서는 충분하다. The End of Theory, 말 그대로 이론의 종말이다.

*주제와의 연관성

빅데이터와 사회과학이라는 주제에 대해서 조사 중, 이 전에 조사했던 논문에서 빅데이터의 지식 모델은 “이론의 종언”(the end of theory)를 선언한다고 하였었다. 이 글은 The end of Theory란 말이 나온 원문으로서 페타바이트 시대인 빅데이터 시대에서는 이제까지 해오던 사회과학을 포함한 과학적 방법들은 구식이라고 하며 이제는 오로지 상관관계만이 중요하다고 말한다. 더 이상 과학에서 인과관계를 보지 않고 상관관계만을 중시하겠다는 앤더슨의 태도는 빅데이터의 등장으로 인한 또 하나의 사회적 현상이라고 볼 수 있다.

2.세이버 메트릭스를 활용한 한국프로야구 기록시스템제안, 강정구, 박석천, 김종현, 한국인터넷정보학회, 한국인터넷정보학회 학술발표대회 논문집, 2014년 5월, 143-144 (2pages)

야구는 흔히 기록의 스포츠라고 말한다. 야구로부터 발생된 데이터는 선수를 평하고, 경기를 운영하는 지표로 사용 된다. 하지만 현재 한국 프로야구 기록 시스템은 단순 기록만 보여주고 자세히 기록된 데이터를 활용하지 않고 있는 실정이다. 이에 이 논문에서는 야구 통계 방법인 세이버 메트릭스를 활용한 한국 프로야구 기록 시스템을 제안한다. 세이버 메트릭스는 통계학자 출신인 Bill James 가 창시한 SABR (Society for American Baseball Research)에서 만들어진 단어로 야구에 관한 수치를 통계학적이고 객관적인 방법으로 분석하는 기법을 말한다. James(1982)는 타율에 비해 저평가되었던 출루율을 중요한 척도라고 주장하며, 출루율과 장타율의 개념을 합친 OPS(On base percentage Plus Slugging percentage) 개념을 만들었고, 이를 통하여 야구 통계인 세이버 메트릭스를 알렸다. 그 후, 야구팬들은 독자적으로 경기통계를 기록하고 분석하여 의견을 교환하는 네트워크를 분석하였고 이후 세이버 메트릭스의 요인들은 Furtado와 Palmer (2000) 등에 의해 2000년도부터 현재까지도 보안되어 오고 있다.
기존 한국 프로야구의 기록 시스템은 경기수, 타석수, 타수, 득점, 안타, 2루타, 3루타, 홈런, 루타, 타점, 도루, 볼넷, 삼진, 병살 등 비교적 간단한 경기 기록만 제공하고 있다. 이러한 시스템으로는 선수의 개인 능력을 정확하게 파악하기 힘들다. 따라서 타율, 출루율, OPS뿐만 아니라, RC(Run Created), RC27(Runs Created Per 27 Outs), XR(eXtrapolated Runs), ISO(Isolated Power), BIBAP(Batting Average on Balls in Paly) 등 다양한 세부 기록을 표기할 수 있는 세이버 메트릭스를 활용한 야구 기록 시스템을 제안한다. 본 논문에서 제안하는 세이버 메트릭스를 활용한 한국프로야구 기록 시스템의 구성도는 그림1과 같다. 본 시스템은 수집, 데이터 처리 및 가공, 그리고 출력 및 시각화로 구성된다. 이를 통해 기존 데이터를 수집하여 선수들의 능력을 다방면에서 평가하고, 경기 운영에 다양하게 활용할 수 있을 것으로 사료된다.

*주제와의 연관성

앞서 우리는 논리실증주의와 더불어 머니볼이론과 세이버메트릭스에 대해 조사했었다. 이 논문은 세이버메트릭스를 실제로 한국 야구에 적용하는 것을 제안하며 또한 세이버메트릭스 이론에 대해 간략하게나마 설명하고 있다. 이 논문을 읽음으로서 실제 전문가들은 세이버메트릭스에 대해 어떻게 생각하며 어떤식으로 사용되는지에 대해 더 알게 될 것이다.

3.빅데이터 시대의 커뮤니케이션연구를 위한 방법적 경계확장과 논의 - 사회과학적 패러다임을 중심으로, 김성태, 한국방송학회 2014 가을철 정기학술대회, 2014.11

위 논문에서 저자는 빅데이터와 사회현상에 관련 지어 빅데이터를 이용한 경제성장을 서술하였다. 빅데이터의 문제점인 개인정보 등 여러 가지 문제도 있지만 경제적 측면으로 봤을 때 구글 아마존 같은 여러 해외사이트 성장처럼 빅데이터를 활용할 줄 알아야 앞으로의 미래가 발전할 수 있다고 보고 있다. 최근에는 페이스북, 트위터와 같은 SNS가 많이 활발하게 성장하고 있으며 사람들이 올린 글과 동영상 즉 비정형데이터들을 활용한 분석들은 우리에게 새로운 가치나 통찰력을 제공해 줄 수도 있다는 믿음을 생길 수 있다고 보며, 어떤 이슈를 해결할 때 새로운 대안적 방법을 제공해줄 수도 있다고 말하고 있다. 또한 소셜 미디어가 사회적 관계, 서비스, 기술, 인프라 등 모든 측면에서 변화를 촉진하고 사회 및 문화 전반에 영향을 미치는 도구로 활용되고 있는 현실을 볼 때, 이를 이용하는 다양한 이용자들의 의견을 반영하여 사회를 발전시킬 수 있는 기초자료로 활용 가능하다고 보고 있다. 간단하게 4가지 미래사회의 특성과 빅데이터의 역할을 살펴보면 첫째의 미래사회 특성에 대한 빅데이터의 역할은 불확실성을 통찰력으로 바꾸어 사회현상, 현실세계의 데이터를 기반으로 한 패턴분석과 미래전망을 할 수 있고, 여러 가지 가능성에 대한 시나리오 시뮬레이션, 다각적인 상황이 고려된 통찰력을 제시, 다수의 시나리오로 상황 변화에 유연하게 대처 등 가능 하다고 보고 있다. 둘째로는 리스크를 대응력으로 바꾸어 환경, 소셜, 모니터링 정보의 패턴 분석을 통한 위험징후, 이상 신호 포착을 할 수 있다고 보며, 이슈를 사전에 인지〮분석하고, 빠른 의사결정과 실시간 대응지원, 기업과 국가 경영의 투명성 제고 및 낭비요소 절감을 할 수 있다고 본다. 셋째로 스마트를 경쟁력으로 바꾸어 대규모 데이터 분석을 통한 상황인지, 인공지능 서비스 등 가능, 개인화〮지능화 서비스 제공 확대, 소셜분석, 평가, 신용, 평판 분석을 통해 최적의 선택 지원, 트랜드 변화 분석을 통한 제품 경쟁력 확보가 가능하다고 말하고 있다. 마지막으로 융합을 창조력으로 보고 있는데 타분야와의 결합을 통한 새로운 가치창출, 인과관계, 상관관계가 복잡한 컨버젼스 분야의 데이터 분석으로 안전성 향상, 시행착오 최소화뿐만 아니라 방대한 데이터 활용을 통한 새로운 융합시장 창출을 할 수 있다고 저서하고 있다. 최종적으로 다양한 학문 간의 경계를 허무는 노력이 필요하다고 말하고 있는데 이는 이질적인 복수 분야의 융합과 통섭을 통해 가치를 창출하고자 하는 사회적 흐름을 반영한 것이기도 하다. 경제학과 심리학을 가로지르는 행동 경제학이나 철학, 심리학, 언어학, 인류학, 신경과학, 인공지능 등의 분야가 복합적으로 결합한 인지과학이 대표적이다. 이러한 흐름은 비단 학문적 영역에 그치지 않는다고 보며 특히IT 업계를 중심으로 하여 두드러지게 나타나고 있다고 하였다.
*주제와의 연관성
논리실증주의1 관점에서 보았을 때 빅데이터 또한 기존 데이터(정보)들을 가지고 미래는 어떠어떠할 것이다 라고 예측하고 명제의 진위 여부를 판단하고 있다. 두 가지 모두 연역적 추론 방식을 통해 명제의 참 거짓을 결론 짓고 있다. 과거 논리실증주의는 어느 정도의 진위를 밝혔지만 사회과학현상에서 어느 정도의 오차가 따르기 때문에 항상 진위여부를 맞추진 못했었다. 이러한 바탕으로 보면 미래의 향 후 빅데이터를 이용한 예측이 다 맞다고 할 수 없다. 하지만 이러한 일상 사회과학 현상에서 일어날 수 있는 확률이 엄청 낮고 우연의 결과가 크기 때문에 꼭 틀렸다라고 볼 수는 없다고 생각한다.

4. 빅데이터의 분야별 활용사례, 김동완, 경영논총 34, 2013.12

빅데이터의 분야별 활용사례에서 빅데이터의 활용에 필요한 3대 요소 및 분야별 활용사례를 서술하였다. 빅데이터의 활용을 위한 자원, 기술, 인력 3대 요소가 있는데 미래에는 빅데이터를 핵심 자원으로 인식하고 필요한 정보를 뽑아낼 수 있도록 리소스를 키우는 것이 중요하고, 빅데이터는 또한 데이터 자체뿐만 아니라 관련 도구나 플랫폼, 분석기법까지 포괄하는 용어로 의미가 확장되며 IT패러다임의 변화를 견인하고 있어 기술분야의 이해가 필요하며, 기술과 툴이 아무리 뛰어나도 실제 성과를 낼 수 있는 것은 이를 활용하여 적용하는 사람 즉 인력이 필요하다고 말하고 있다. 분야별 활용 사례에서 크게 5가지 실생활 사례들의 예시를 보여주고 있으며 첫째 정치 분야 활용사례 둘째 사회 분야 활용사례 셋째 경제 및 경영 분야 활용사례 넷째 문화 분야 활용사례 마지막으로는 의료 분야 활용사례이다. 이처럼 5가지 모든 활용 사례는 기존 데이터와 과거 데이터들을 데이터 분석기법 기술을 통한 활용으로 볼 수 있다. 논리실증주의와 마찬가지로 빅데이터들의 활용과 실생활 적용은 비슷한 점을 볼 수 있는데 서로 가설 명제를 검증할 때 검증 기술이 유사한 점을 찾을 수 있다. 우리가 대통령 선거 시 누가 당선이 될 것인지 사전 조사를 통해 어느 정도 오차범위를 두고 추론하는데 사전 조사와 다르게 선거를 안 하는 사람도 있고 마음이 바뀌어서 다른 후보자를 뽑는 경우도 있어 과거 1936 루즈벨트 대통령선거에서 Literary Digest 예측은 43%, Literary Digest 예측치에 대한 갤럽의 예측은 44% 갤럽의 예측은 56%였다. 하지만 실제 선거 결과 루즈벨트 득표율은 62%의 결과가 나왔다. 물론 표본추출편향의 잘못된 조작적 정의를 통해 유추를 하여 큰 오차를 냈지만 대체적으로 부정확한 통계를 보여준다.

*주제와의 연관성

이처럼 논리실증주의의 기법 또한 아주 정확한 것은 아니다. 이처럼 빅데이터의 기반은 논리실증주와 많이 닮은 것처럼 보인다. 또한 부정적인 측면도 같은 양상을 보여주고 있다. 논리실증주가 활발하게 활동할 때 반증주의학파들이 논리실증주의에 대하여 반박을 하고 비판을 하였다. 그들은 하나의 거짓된 정보를 찾으면 모든 것이 참이라고 할 수 없기에 논리실증주의는 사회현상에서의 오차가 있기 때문에 비판하였다. 이는 오늘날 빅데이터에 관한 비난과도 같은 모습을 보인다. 단순히 데이터를 분석하여 미래의 일은 예측하는 것은 정확한 것도 아닐뿐더러 단순히 수학적 통계가 사람의 앞일을 정하는건 말이 안 된다고 하고 있다. 하나의 예시로 머니볼이론2이 탄생한 과거 미국 메이저리그를 들 수 있는데 메이저리그 오클랜드의 구단주는 야구 데이터를 분석하여 승률을 위해 아무도 영입하려 하지 않을 선수들을 데리고 와서 비난을 받았다. 아무리 데이터가 중요하더라고 하더라도 사람이 하는 야구지 수학적 통계대로 사람은 행동할 수 없다며 비난을 삼았다. 하지만 그 해에 오클랜드3는 우승은 하지 못 하였지만 메이저리그 최초 20연승을 하는 기적을 이루어 냈다. 이처럼 논리실증주의의 관점에서 본다면 빅데이터는 논리실증주의를 기반으로 시작했다고 봐도 무관하다. 서로의 오차로 인해 비난을 삼아도 그 오차의 확률은 어쩌면 기적에 가깝다고 볼 수 있다. 그 기적 같은 오차의 확률 때문에 우리의 실생활에 편의를 제공하고 이익을 창출하는 것을 포기해 버리는 건 너무 아쉽지 않을까 라는 의구심이 생기게 된다.

5.빅데이터 시대의 소셜 네트워크 분석기법과 스포츠 분야의 활용전략, 박성제, 이제욱, 한국체육과학회, 한국체육과학회지 23(5), 2014.10, 933-946(14pages)

위 논문(박성제, 이제욱.2014.10,933-946)에서는 크게 소셜 네트워크 분석의 진화의 시간적 변화와 스포츠 분야의 소셜 네트워크 분석 활용전략에 대해서 서술하였다. 소셜 네트워크 분석의 초기 연구는 ‘사회연결망’이라는 명칭으로 국내에 도입되었으며 집단, 조직 내의 구성원 간 상호 관계성을 규명하는데 주목성이 있었다. 초기 소셜 네트워크 분석에 대해 부정적 시각의 학자들은 이론적 근거,척도를 기반으로 한 데이터를 통해 통계적으로 인과관계를 도출하는 논의나 함의가 부족하며 현상을 단지 시각화하는데 초점을 두고 있다고 주장하였다. 이러한 비판에도 불구하고 소셜 네트워크 분석은 방법론의 가능성을 인지한 여러 학자들의 지속적인 연구 속에 많은 결과물과 이론들이 생산되었다. 그리하여 사회연결망 분석은 사람관계뿐 아니라 상호 연결 관계가 존재 할 수 있는 대부분을 데이터로 분석하는 것이 가능해졌다. 이수상(2012)은 21세기를 ‘초연결 사회’라고 언급하였다. 사람과 사람 사이는 물론 특성이 이질적인 구성요소 간 관계에서도 마찬가지로 복잡계적 현상은 우리가 눈으로 쉽게 확인 할 수 없지만 분명히 존재한다는 것이다. 이러한 구성요소를 데이터로 정제하여 분석을 통해 시각화하는데 소셜 네트워크 분석이 지금과 같이 발달하고 다시금 부각되는 현상이 맞물려 있다는 말이다. 빅데이터의 초기 정의는 3V로 함축하여 설명할 수 있었는데 대용량(Volume), 비정형성(Variety), 실시간성(Velocity)으로 구성되어 있다. 현재 위키피디아에서 정의하는 빅데이터는 양적인 부분의 규모와 함께 비정형성과 정형성이 공존하고 이러한 데이터로부터 가치를 추출하기 위해 결과를 도출하는 기술로 언급하고 있다(Wikipedia, 2014).하지만 빅데이터 자체만 관찰한다면 확인 할 수 없는 규칙이나 패턴을 데이터 전처리, 정제, 군집화 등을 거치거나 때에 따라서는 원자료에 가까운 규모의 자료를 통해 발견이 가능한데 그것은 데이터 간 네트워크 시각화 결과를 통해 확인이 가능하다는 것을 알게 된다는 것이다. 이것이 소셜네트워크 분석이 현재 빅데이터의 주요 분석기술 방법 중 하나로 역할을 하게 된 계기이며 빅데이터를 링크 데이터로 표현한 결과를 통해 분석, 예측, 전략수립 등을 시도하는 분야는 지속적으로 확대되고 있다(EMC,2011).이러한 소셜 네트워크를 통해 빅데이터를 분석을 활용하게 되는데 스포츠 분야에서의 분석은 4가지가 존재한다. 지식데이터를 활용한 Knowledege Map 구축 연구, SNS 분석, 공공데이터 분석, 선수 및 경기분석이 존재하게 된다. 국내에서도 초기접근 형태의 소셜 네트워크 분석을 이용해 경기분석을 실시한 바 있으며 해당 사례에서 그 가능성을 찾아볼 수 있다. 패스연결망을 통해 소셜 네트워크 분석기술의 활용 가능성을 규명하고자 한 김혜진(2007)과 임정우(2009)의 연구가 있으며 배구선수의 공격 패턴을 데이터 마이닝과 소셜 네트워크 분석을 통해 밝힌 강병욱(2013)의 연구, 축구경기 결과를 네트워크로 시각화 하여 제시하고자 한 최영화(2012)의 연구가 있다.

*주제와의 연관성

정확한 통계를 기반으로 하여 빅 데이터를 분석을 해야 하므로 통계가 부정확하다면 잘못된 정의를 내린다는 점에서 논리적 실증주의와 유사한 점이 보인다. 소셜 네트워크 분석에서 정보가 하나라도 잘못된 것이 있다면 그 잘못된 정보를 토대로 비판을 하는 점과 논리적실증주의의 하나의 거짓된 정보를 찾으면 거짓이라고 하는 논리실증주의의 주장 역시 유사하다고 볼 수 있다. 정확한 데이터를 기반으로 통계나 분석을 한다는 점에 있어서 논리실증주의적 관점에서 본다면 빅데이터는 논리적 실증주의를 기반으로 빅데이터 라는 정의를 만들 뿐 더러 여러 논리적 실증주의와 유사한 이론들도 만들었다고 볼 수 있다라는 생각을 들게 하였다.

6.빅데이터 업체 SNS 자료의 증거능력에 관한 연구 : 서울중앙지방법원 2014.9.11 선고 2013고합577 1060 판결을 중심으로, 성빈, 동국대학교 사회과학연구원, 사회과학연구 22(1), 2015.3, 7-26(20pages)

위 논문은 크게 SNS와 빅데이터에 관한 이론적 논의와 빅데이터 업체가 보유한 SNS자료의 증거능력 관련 쟁점, 빅데이터 업체가 보유한 SNS자료의 활용 관련 판례의 문제점을 다루고 있다. SNS(Social Networking Services)란 아직까지 통일된 학술적 정의는 없지만 해당 용어를 그대로 번역하면 사회관계망 서비스로 정의할 수 있으며 학술적으로는 개인의 사이버 공간인 웹 페이지를 통해 자신의 일상과 생각을 다른 사람들과 공유하면서 그들과의 관계를 구축해 나가는 새로운 형태의 사회관계망이라는 정의가 있다.(박종승,최응렬,2013:89-90) 최근 자료에 의하면 국내에서 사용되는 SNS에는 트위터, 페이스북,카카오 스토리,싸이월드 ,미투데이 등 그리고 SNS를 구성하는 개념적 요소로는 정체성,존재,관계,대화,그룹,평판,공유 등이 있다. 위키백과 사전에 따르면 빅데이터는 기존 데이터베이스 관리도구로 데이터를 수집, 저장 ,관리, 분석할 수 있는 역량을 넘어서 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술로 정의되어 있다. 빅데이터는 대용량 데이터들이 새로 등장한 빅데이터 기술을 이용하여 효과적인 분석이 가능하게 되며 많은 사람들이 관심을 가지게 되었다. 이처럼 빅데이터의 경우 과거 일반적인 방식의 분석방법으로 과다한 비용과 시간이 소요되는 단점이 있어 분석 전문가가 필요한 분야가 되었다. 이러한 관점에서 빅데이터는 단순히 대량의 데이터를 빠르게 분석하는 것이 아니라 수많은 데이터를 가장 효과적으로 분석하는 방법과 기술로 정의될 수 있다(홍민성, 2014:6-7)빅데이터 관련 법률적 쟁점에 있어 다양한 종류의 대규모 데이터에 대한 생성, 수집, 분석, 표현을 그 특징으로 하는 빅데이터 기술의 발전은 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하고 개인화된 현대 사회 구성원마다 맞춤형 정보를 제공, 관리, 분석 가능케 하며 과거의 불가능했던 기술을 실현시키기도 한다. 이 같이 빅 데이터는 정치, 사회, 경제, 문화, 과학 기술 등 전 영역에 걸쳐 사회와 인류에게 가치 있는 정보를 제공할 수 있는 가능성을 제시하며 그 중요성이 부각되고 있다.
*주제와의 연관성
우리는 빅데이터의 다변화된 현대 사회를 더욱 정확하게 예측하는 점에서 이 점이 논리적 실증주의의 성질과 유사한 점이 존재한다. 정확한 정보를 기반으로 논리를 따지는 식의 논리적 실증주의와 정확한 통계를 기반으로 데이터를 분석한다는 점에서 이 역시 유사하다고 볼 수 있다. 수학적 통계를 토대로 빅데이터를 분석하는 면에 있어 한 치의 오차 역시 용납하지 않는 특성은 하나의 거짓된 정보가 보인다면 모든 것이 참이라고 할 수 없는 논리 실증주의의 특성과 비슷한 면을 보여준다.

7. 빅데이터 시대의 도래, 응용환, 韓國情報技術學會誌 제10권 제3호, 2012.9, 39-43 (5pages)

위 논문 에서는 빅데이터 시대가 도래하면서 다 방면에서 기술이 변화했다고 서술하였다. 과거에는 콘텐츠 생산자와 소비자가 나누어져 있었으나 블로그, 소셜 네트워크 서비스 등 커뮤니티가 활성화 되면서 그 경계가 사라졌다고 주장하고 있다. 그 결과 누구나 자신의 의견을 주장할 수 있고 정보를 생산할 수 있으며 유통도 할 수 있게 되었고 개인화 서비스와 모바일 디바이스가 대중화 되면서 모든 개인 정보가 인터넷 공간에 저장될 수 있다고 말한다. 즉 데이터가 상상을 초월할 만큼 급증했다는 것이다. “빅데이터’ 속에서 가치 있고 의미 있는 정보를 찾고자 하는 노력이 더욱더 주목을 받기 시작하면서 “빅데이터 시대” 라는 사회현상이 출범 하게 된 것이다. 이러한 빅데이터 시대의 도래는 데이터 량의 급증을 불러왔고 처리 속도의 한계, 플랫폼 확장의 어려움 등을 대두시켰다. 특히 소셜네트워크(SNS)에 속하는 Facebook, Twitter 등과 멀티미디어 서비스인 Youtobe, Flickr등의 성장으로 인한 비정형 데이터의 증가는 기존 플랫폼을 통한 데이터 저장과 관리, 분석의 한계를 부각 시켰다고 말한다. 이런 고민을 해결하기 위해 구글의 논문은 2003년 GFS(Google FileSystem), 2004년 MapReduce, 2006년 BigTable 등을 발표했다. GFS는 저렴한 사양의 하드웨어 장비를 연결해 만든 분산 네트워크 파일 시스템으로써 현재 전세계적으로 주목을 받고 있는 클라우드 기술을 발전하는데 기폭제가 되었다. MapReduce와 BigTable은 분산 컴퓨팅 환경에서 대용량 데이터를 분석하고 저장하기 위한 기술로써 빅데이터 산업의 핵심 기술이 되었다. 또한 구글의 논문을 비롯하여 전세계 적인 분산 데이터 처리에 대한 연구는 오픈소스 프로젝트인 아파치 하둡과 다양한 NoSQL 제품 등이 산업에 적용되는 성과로 이어졌다.
결론적으로 현재 빅데이터는 여러 기업과 분야에서 활성화되어 그 쓰임새가 더욱 더 광범위해지고 있다. 아마존의 추천 상품, 포스퀘어의 위치 데이터 분석, 트위터의 여론 데이터 분석, 네이버 실시간 급 상승 인기 검색어, 온라인 게임의 실시간 이용자 패턴 분석 등에 활용되고 그 결과가 우리의 생활에 영향을 미치고 있다고 말한다. 또한 NHN은 2010년 '네이버 ME'라는 개인화 서비스를 출시한 이후 지속적으로 업그레이드를 하고 있는 만큼 IT 기업들도 개인화와 빅데이터에 대한 기술을 지속적으로 연구, 개발하고 있다. KT는 KT 클라우드웨어를 설립하여 클라우드 기반의 빅데이터 플랫폼을 구축하고 있으며 다른 대기업들도 앞다퉈 하둡 기반의 분산 환경을 마련하고 있다고 한다. 이는 앞으로 스마트폰과 같은 개인휴대 단말기가 더욱 보급되면 IT 산업의 중심이 자연스럽게 개인화 서비스로 이동하면서 처리해야 할 데이터 양이 늘어날 것을 예상하는 것을 말한다. 1990년대 후반을 시작으로 2000년대 초반까지 이어지던 인터넷 부흥기 때에는 가격경쟁 시대였다. 인터넷 기반의 무료 서비스가 대거 등장하면서 유효 서비스를 제공하던 기업들은 사라지거나 무료로 전환해야만 했다. 2000년대 중반부터는 접근성을 높이고 시스템 속도를 빠르게 하며 무 중단 서비스를 제공하는 품질경쟁 시대라 볼 수 있다고 주장한다. 2010년대에 들어서는 분산처리에 대한 관심이 높아졌다. 클라우드 서비스가 인기를 끌고 있고 인터넷 사용자들은 자신의 사진과 글, 주소록 등 개인 정보를 기꺼이 인터넷 플랫폼에 제공하거나 공유하고 있다. 그러므로 가까운 미래의 IT 산업에서는 기업간 빅데이터 처리 기술에 대한 경쟁이 더 심화될 것이며 빅데이터 기술의 차이가 제품 경쟁력 뿐만 아니라 사용자만족도를 좌우하게 될 것이라 주장하고 있다.

*주제와의 연관성

최근의 트렌드로 대두되고 있는 빅데이터는 사회과학의 논리실증주의와 연관성이 있다. 논리 실증주의는 원리의 체계가 아니라 하나의 연구의 프로그램이라 말한다. 연구프로그램에 관여하는 철학자는 공통적인 도구와 테크닉을 사용하여 과학적 지식의 본질을 분석한다. 이처럼 최근 빅데이터 시대의 도래는 원래 짜여져 있던 형식의 원리 체계가 아닌 시대가 발전을 거듭해옴에 따라 그 발전가능성을 연구하고 이를 기반으로 빅데이터를 분석한다는 점에서 논리실증주의와 연관성이 있다고 볼 수 있다.

8. 빅데이터 와 클라우드 시대 , 운용익, , 김 스베틀라나 한국통신학회지 (정보와통신) 제30권 제4호, 2013.3, 3-6 (4pages)

위 논문에서는 IT(Information Technology) 시장의 새로운 패러다임으로 급부상하면서 클라우드와 빅데이터는 더 이상 하나의 흐름이 아닌 변화를 주도해 간다라는 주장한다. 대부분의 관리자들은 클라우드 인프라의 효과적인 도입 혹은 빅데이터의 효과적인 관리에 집중하고 있지만 실질적으로 더 중요한 것은 이러한 자산을 효과적으로 활용하는 것이라 말한다. 클라우드와 빅데이터는 강력한 자산 및 도구이지만 이들은 수단이지 목적은 아니라는 것이다. 빅데이터를 통해서 어떤 혜택을 가져올 것인지가 궁극적인 목적이며 클라우드를 활용해서 어떤 비즈니스 기회 또는 가치를 제공할 수 있는지가 중요하다고 말한다. 이런 관점에서 빅데이터와 클라우드를 기술적 관점과 비즈니스 관점 즉, 두 가지를 같이 보는 시각이 필요하다고 말한다.
클라우드는 가상화라는 이름으로 등장하였고 가상화는 기업에서 IT 자원을 효율적으로 운영하여 예산을 절감하고 보안 등의 이슈를 해결할 수 있는 유일한 솔루션으로 자리 매김하고 있는 것이 현실이다. 하지만 빅데이터가 등장함으로 인해서 클라우드와 빅데이터는 서로 밀접하게 자리 매김을 하고 있고 서로를 보완해 주는 새로운 모델로 각광받고 있다. 클라우드의 명제는 언제 어디서나 어떤 디바이스로도 원하는 정보를 갖고자 하는 욕구를 해결할 수 있는 유일한 수단으로 폭발적으로 늘어나는 빅데이터 시스템 환경에서 클라우드는 새로운 대안이라 주장하고 있다.
빅데이터는 하루아침에 만들어진 단순한 트렌드가 아니고 이미 오래 전부터 많은 데이터를 처리하기 위한 많은 노력으로부터 잉태된 산물이라 말한다. 이러한 대규모의 빅데이터를 처리하기 위해서는 관련 시스템의 도입을 최소로 하고 유연하게 확대 적용할 수 있는 것이 오픈 소스를 중심으로 한 분석시스템이다. 이 부분에 클라우드를 적용한다면 요구되는 성능상의 이슈는 발생할 수 있겠지만 운영적인 면에서 효율을 갖춘 Big data 시스템으로 탈바꿈할 수 있을 것이라 주장하고 있다. 빅데이터를 위한 인프라가 언제 어디서나 다양한 디바이스와 다양한 채널로 커뮤니케이션이 일어나고 보안과 관리의 경계도 없어지면서 엄청난 양의데이터가 빠른 속도로 생성되고 데이터의 종류와 소스가 너무 많아졌다. 과거 테이블 기반의 관계 형 데이터베이스의 관점에서 볼 때 멀티미디어는 물론 소셜 미디어의 피드와 같은 데이터는 기존 개념으로는 처리할 수 있는 데이터와 범위를 벗어난다는 것이다. 이러한 빅데이터는 방대한 새로운 형태의 데이터가 출현한다는 것을 의미하며, 기업들은 빅데이터 분석을 통해 가시적으로 드러나지 않는 변화의 흐름을 파악하고 새로운 형태의 방해한 데이터 분석을 통해 과거에 불가능했던 새로움을 창조하는 시대를 일컫는다. 모바일 시대와 함께 기업들은 고객들과 직접 관계를 형성해 고객 정보나 고객이 만들어내는 데이터를 직접 활용할 수 있게 되었다고 주장하고 있다. .

*주제와의 연관성

논리실증주의가 탐구 방식이라는 것과 새로운 과학 철학의 전개도 과학 혁명의 빅데이터와 동일한 종류의 지적 혁명이라는 것을 보여준다는 것에서 연관성을 찾을 수 있다. 우리는 과학 이론을 그 이론에서 연역해 낸 귀결(consequence)로 테스트 사회과학현상에서 하나의 명제를 일반화 하여 명제의 참 거짓을 증명한다. 그러므로 어느 정도 오차 범위가 있을 수 밖에 없다. 훗날 반증주의자들에게 비난을 받았지만 우리 삶에 사회과학현상은 항상 100% 정확할 수는 없다. 단 하나의 거짓을 발견하지 못 한 정보가 있어서 우리는 그것이 참이라고 오해할 수 도 있다는 것이다. 빅데이터 또한 방대한 데이터들을 모으고 일반화 적용시켜 오차가 발생하여 사람들의 비난을 받기도 한다. 하지만 이러한 적은 오차를 기각을 하고 손을 놓고만 있다면 과연 옳은 일 일지 의문이 든다.

3)
p & q) 예를 들어 까마귀가 날고 배가 떨어지는 경우)을 관찰하는 경우도 있고 또 인과관계를 맺으며 발생하는 사건들((p → q) 예를 들어 금속에 열을 가했기 때문에 금속이 팽창하는 경우)을 관찰하는 경우도 있다. 인과관계를 맺는 사건들 사이에는 필연적 연결이라는 어떤 힘이 들어 있어 이 두 사건으로 하여금 인과관계를 맺도록 한다는 것이다. 흄은 이에 반대하였다. 흄에 따르면 이 세계 내의 사건들은 모두 시/공간적으로 인접해 발생할 뿐이지((p & q
4)
p → q
c/mt/2015/group_03.txt · Last modified: 2016/07/01 14:55 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki