본문 바로가기

수학 이야기/ㅅ ● 수리통계학

수리통계학 Mathematical Statistics 표본공간,사상 events,공사상,여사상,합사상,배반사상

 

 

 

 

 

 

 

 

 

 

   

 

 

 



 




 

통계학

Oldfaithful3.png

통계학(統計學)은 통계에 관한 연구를 하는 학문이다.

개요

통계학은 응용 수학의 한 분야로서 관찰 및 조사로 얻을 수 있는 불균형적인 데이터로부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾아낸다. 통계적 기법은, 실험 계획, 데이터의 요약이나 해석을 실시하는데 있어서의 근거를 제공하는 학문이며, 폭넓은 분야에서 응용되어 실생활에 적용되고 있다.

어원

영어statistics(통계학, 통계)는 확률을 뜻하는 라틴어statisticus(확률) 또는 statisticum(상태), 이탈리아어statista(나라, 정치가) 등에서 유래했다고 한다. 특히 국가라는 의미가 담긴 이탈리아어 statista의 영향을 받아, 국가의 인력, 재력 등 국가적 자료를 비교 검토하는 학문을 의미하게 되었다.

역할

매우 다양한 분야의 연구에서 주어진 문제에 대하여 적절한 정보를 수집하고 분석하여 해답을 구하는 과정은 아주 중요하다. 이런 방법을 연구하는 과학의 한 분야가 통계학이다. 통계학을 필요로 하는 연구분야는 농업, 생명과학, 환경과학, 산업연구, 품질보증, 시장조사 등 매우 많다. 또한 이러한 연구방식은 기업체와 정부의 의사결정과정에서 현저하게 나타난다. 주어진 문제에 대하여 필요한 자료의 형태, 자료를 수집하는 방법, 문제에 대한 최선의 답을 구하기 위한 분석방법을 결정하는 것이 통계학자의 역할이다.

자료는 어떤 특정한 현상(주제, 사실)을 조사하기 위하여 설계하고 계획한 실험에서 나온다. 이런 종류의 자료, 즉 실험자료는 농업연구와 같은 분야에 흔히 있다. 통계학자들은 이미 나온 실험자료를 분석하는데만 관심이 있지않고, 자원을 효과적으로 사용하고 주어진 문제를 실험으로 해결하기 위하여 처음부터 실험을 계획하는데 관심이 있다.

또 다른 형태의 자료를 관측으로부터 얻는다. 조사자들은 연구실 밖으로 나가서 실제로 존재하는 것을 조사한다. 이런 예로는 인구 및 주택센서스와 같은 전수조사, 여론조사, 교통량조사 등등이 있다. 이 경우 조사방법과 설문지 작성은 매우 중요한 문제가 된다.

설문지 조사에 있어서 가장 핵심적인 부분은 설문지 작성 요령이다. 묻고자 하는 질문을 짧고 명확하게 물어야 하고 응답자가 고민을 하지 않고 바로 대답할 수 있도록 구성해야 한다. 설문지는 묻고자 하는 질문이면 무엇이든지 다 물을 수 있는 것이 아니라 문제의 핵심적 내용을 담고 있어야 한다.

용어

통계적 방법

실험 계획

실험계획은 자료수집전에 미리 어떻게 실험할것인지 계획하여, 원하는 자료를 정확하게 수집하고 기록할 수 있도록 하는 분야이다. 자료 수집의 규모와 대상, 할당 방법을 바르게 결정하고 정당한 자료를 수집할 수 있도록 검토한다. 설문지 작성법 등도 여기에 포함된다. 통계를 공부하는 이들 사이에 'Garbage in, garbage out'이라는 말이 있다. 이는 '쓰레기 같은 자료를 사용하면 아무리 분석을 잘하더라도 그 결과는 쓰레기일뿐이다.'라는 의미로, 자료를 수집하기 전에 그 방법을 충분히 검토할 필요가 있다는 것을 강조한 말이다.

설문지 작성

설문지 작성은 실험계획의 일부이기도 하지만, 대개 별개의 실습을 통해 채득해야 한다.

추론 통계

추론 통계는 기술통계로 어떤 모집단에서 구한 표본정보를 가지고 그 모집단의 특성 및 가능성 등을 추론해내는 통계적 방법이다. 보통 수집된 자료는 어떻게 분석해야 할지 미리 정해져 있기도 하지만, 대부분 획득한 자료(모집단)을 가지고 여러 그래프를 그려보는 와중에 또다른 별개의 분석방법을 추가로 채택할 필요성을 느끼게 된다. 이러한 모집단에 대한 전체적 조감을 해보고 또다른 분석방향을 모색해 보는 과정에 해당한다.

기술 통계

기술(記述) 통계는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법이다. 기술통계에는 분석방향에 따라 여러가지가 있다. 단순한 평균 분산 등의 상투적인 분석 이외에, 모집단에서 어떤인자들이 있는지 뽑아내보는 인자분석과, 특정표본이 어떤모집단에 속하는지(원 모집단을 어떻게 여러 집단으로 나눠야 하는지) 판단하는 판별분석, 두 인자간의 상호관계에 대한 정준상관분석, 인자들의 숫자를 줄여 단순화 하는 주성분분석, 그 외 군집분석 등, 다양한 분석방법이 존재한다.

통계분석 소프트웨어

SAS (Statistical Analysis System) - 기업체에서 주로 쓰는 대표적 프로그램이다. 큰 규모의 자료를 편리하게 다룰 수 있으나 각종 통계 분석 결과를 왜곡해서 보여준다는 비판을 받기도 한다. [1]

R (프로그래밍 언어)은 무료 공개 통계 프로그래밍 환경이다. S 언어에 바탕을 두고 개발되었으며, 학술적 목적으로 널리 사용된다. 새로 개발된 분석 방법들이 확장 패키지를 통해 공개되고 있다.

SPSS (Statistical Package for the Social Sciences)는 1995년 윈도 버전이 출시되었다. 다양한 통계분석을 할 수 있고 사회과학, 의학 등 전 분야에서 다양하게 쓰이는 프로그램이나 계산 속도가 느려 큰 규모의 자료를 다루기에는 편리하지 않다.

MINITAB - 학교와 기업에서 품질관리와 통계학 교육용으로 많이 사용되는 프로그램이다.

통계학과 관련 과목

전산학개론, 일반수학, 프로그래밍언어, 통계학개론, 선형대수학, 해석학, 탐색적자료분석, 분포론, 행렬대수학, 수치해석, 확율론, 회귀분석, 수리통계학, 다변량자료분석, 통계계산, 실험계획법, 통계적품질관리, 비모수통계학, 기타


<< 통계학 샘플(무료)강의를 볼 수 있는 유투브 채널 >>