취미/지식저장소

통계학에 대해 알아보자_feat 기말고사

집순이@ 2017. 5. 17. 19:03

회사 일에 쫓기고 주말엔 친구들과 놀러다니다 .. 결국 출석수업 두과목을 놓쳐버렸다. 까맣게 잊고 있었다. 공부에 들어가는 에너지를 줄이기위해 비슷한 과목끼리 과목을 짜다보니 학년도 뒤죽박죽이어서 무척 헷갈리고 정리도 잘되지 않았다.

 다음학기부터는 학년별 커리큘럼에 따라서 교과목을 짜는게 좋겠다고 생각했다. 다음주 기말고사인데 동영상 1도 안들었다. 

 

출석수업에 못갔더라도 너무 실망하지 말자!! 대체시험일정을 확인하고 보면 된다. 우리의 목적은 학위이지 학점이 아니지 않은가라며 애써 위로해본다.  

 

 

들어가며...

  

 통계학개론 및 방법론, 패키지로 어떻게 구현할 것인가를 배웠다. 이러한 원리를 학습하는 교과목이 통계학의 개념 및 제문제라는 과목이다. 사전과목으로 대학수학, 통계학개론과 같은 과목을 수강하면서 복습하는 것이 좋겠다. 

 

1. 통계학 원리

 

가설을 세우고, 통계량을 만드록 가설을 검증하고 판단하는 것에 대한 원리가 이 교과목의 목적이라고 할 수 있다.

통계학의 종류는 두가지로 나누어서 설명할 수 있다. 불확실성과 DATA의 두가지 측면이다.  

 

 

 

2. 용어 정리

 

모집단은 특정한 모수에 의존한 함수의 형태를 띤 확률분포를 따른다고 가정한다. 모집단은 불확실하고 확률분포를 가진다. 모집단으로부터 표본을 추출하는데 이것이 통계량이고 표본들도 일정한 분포를 가지고 있다.

  

※ 데이터만으로 모집단을 추정하는 방법을 빈도론자(prequentist)라고 하고, 모수에 대한 사전정보를 바탕으로 추정하는 것을 베이지안(bayesian)추론이라고한다.

 

 

3. 통계적 추론

 

통계적추론이란 집단에서 뽑은 표본을 이용하여 모수를 추측하는 것이다. 통계적 추론은 추정검정으로 구분된다. 통계추론을 이해하려면 확률모형, 데이터 통계학의 논리를 이해해야한다.

 

 확률이론

  모집단과 표본의 분포에 관련된 것

 추론이론

  표본평균을 이용할 것인지, 어떻게 검증할 것인지

 

 

4. 통계추론의 구조

 

통계추론이라는 것은 불확실성을 계량화하는 것이라고 할 수 있다.

  

 통계적 추론과정을 정리하면,

 

 먼저 확률변수(x)의 모집단은 모수(θ)를 바탕으로 한 확률분포를 가진다.  확률분포는 확률질량함수 또는 확률밀도함수 f(xlθ)에 의해 결정된다. 모집단을 대표할 수 있도록 표본을 임의로 추출한다. 

 

표본추출의 조건

- 같은분포

- 서로독립

이와 같이 가정하고 추론을 한다. 

 

 

5. 추정의 원리

 

추론의 원리로는 가능도원리와 충분성 원리  등이 있다. 추정량의 유용성은 모수와 추정량 차이의 함인 손실함수의 기대값인 평균제곱오차를 최소화하는 통계량이다.

모집단이 정규분표를 따르는 경우 표본평균은 불편성과 효율성을 모두 같은 통계량이라고 할 수 있다.  불편성은 편의가 없는 상태를 뜻하고, 효율성은 통계량 A와 B가 있을 때, Var(분산)이 더 적은 통계량이 효율적인 통계량이다.

 

6. 통계추정의 역사

 

칼피어슨 : 1857년 출생, 양자역학의 태동시기에 물리학적인 변화가 있었다. 철학과 수학에 관심이 있었다. 4개의 평균, 분산, 왜도 첨도라는 값으로 분포 파악하였다. 20세기에 가장 중요한 20가지로 꼽히는 카이제곱 검정을 발명한 것으로도 유명하다.   

 

고셋 : 데이터의 수가 적은 경우에 사용가능한 T분포를 연구하였다.

 

피셔 : 현대통계학의 시발점을 만들었다. 가능도함수를 이용한 추정, 유의성검정, 분산분석, 충분성, 효율성과 같은 대부분의 이론을 창시한 학자이다.

 

네이만 : 칼피어슨의 아들로 신뢰구간이라는 개념을 도입하였다.

 

 

방통대 편입하고 처음으로 집중해서 1강을 완강한 것 같다. 집에가서 다시 2강부터 달려야겠음