통계학이란 하나의 응용과학이다. 결국 어떠한 데이터를 가지고 일정한 확률적 추측을 내릴 수 있는 학문이라는 것이다. 또한 통계학은 공통과학으로 볼 수 있다. 통계는 어느 분야에 국한되지 않고 사용되는 학문이라는 것이다.
통계학이란 데이터의 수집, 분석, 해석, 전달, 응용 등에 관한 학문이다.
데이터의 관점에서 통계학은 데이터의 수집과 데이터의 분석이라는 2가지의 기능과 성격을 지닌다.
(1) 데이터 수집
문제가 주어진 상황에서 통계학은 그 문제의 본질을 파악하고 이해하는데 필요한 데이터를 어떤 방법으로 얻어낼 것이며, 어떤 형태로 정리하거나 가공할지에 대한것을 다루는 학문이라고 볼 수 있다.
(2) 데이터 분석
데이터가 먼저 주어진 상황이라면, 통계학은 주어진 데이터를 이용하여 어떤 주제의 의미를 분석하거나, 그 주제 안의 정보를 추출해 해석하고, 나아가 그 정보를 적용하는 지식 및 지혜로의 활용이 가능하도록 하는 것에 의의가 있다.
결국 통계학의 기초는 데이터가 된다. 그렇다면 좋은 데이터의 요건은 무엇일까? 이는 3가지로 볼 수 있다.
데이터의 내용에는 어떠한 정보가 들어있어야 좋은 데이터라고 볼 수 있을까?
먼저 데이터에는 가능한 한 다양한 정보가 포함되어야 한다. 어떠한 현상이나 물체 등을 조사한다고 가정해보자. 대상에 대한 여러 정보가 포함될수록 대상에 대한 자세하고 유연한 분석이 가능할 것이다. 따라서 다양한 정보가 포함되는 것이 중요하다.