콘텐츠
통계에서 가우시안 (Gaussian) 또는 정규 분포는 여러 가지 요인으로 복잡한 시스템을 특성화하는 데 사용됩니다. Stephen Stigler의 통계 역사에서 설명한 것처럼 Abraham De Moivre는 Karl Fredrick Gauss의 이름을 가진 분포를 발명했습니다. 가우스의 기여는 가장 적합한 선으로 데이터를 피팅 할 때 오차를 최소화하기위한 최소 제곱 법에 대한 분포를 적용하는 데있었습니다. 따라서 통계에서 가장 중요한 오류 분포로 만들었습니다.
동기
데이터 샘플의 분포는 무엇입니까? 데이터의 기본 분포를 모른다면 어떻게해야합니까? 근본 분포를 모른 채 데이터에 대한 가설을 테스트 할 수있는 방법이 있습니까? 중앙 한계 정리 덕분에 대답은 그렇습니다.
정리의 진술
무한 모집단의 표본 평균은 근사 또는 가우시안이며 기본 모집단과 평균이 같으며 모집단 분산을 표본 크기로 나눈 것과 같습니다. 표본 크기가 클수록 근사치가 향상됩니다.
근사 진술은 정규 분포에 대한 수렴에 대한 결론으로 간혹 누락되기도합니다. 표본 크기가 증가함에 따라 근사 정규 분포가 변하기 때문에 그러한 설명은 잘못된 것입니다.
정리는 Pierre Simon Laplace에 의해 개발되었습니다.
왜 모든 곳에
정규 분포는 전 방향입니다. 그 이유는 중앙 한계 정리에서 나옵니다. 종종 값을 측정 할 때 많은 독립 변수의 합계 효과입니다. 따라서 측정되는 값 자체는 샘플 평균 품질을 갖습니다. 예를 들어 운동 선수의 성과 분포는식이 요법, 훈련, 유전학, 코칭 및 심리학의 차이로 인해 종 모양을 가질 수 있습니다. 남성의 키조차도 많은 생물학적 요인의 함수 인 정규 분포를 가지고 있습니다.
가우스 코풀 라스
가우스 분포를 가진“구리 기능”이라고 불리는 것은 2009 년에 담보 채권에 대한 투자 위험을 평가하는 데 사용 되었기 때문에 뉴스에 실 렸습니다. 이 기능의 오용은 2008-2009 년의 금융 위기에 중요한 역할을했습니다. 위기의 원인은 많았지 만, 가우스 가우스 분포는 사용되지 않았을 것입니다. 꼬리가 더 두꺼운 함수는 부작용에 더 큰 확률을 할당했을 것입니다.
유도
중심 한계 정리는 기본 모집단의 mgf 함수로 (샘플 평균-모집단 평균) /? (인구 분산 / 샘플 크기)의 모멘트 생성 함수 (mgf)를 분석하여 여러 줄에서 입증 할 수 있습니다. 정리의 근사 부분은 기본 모집단의 mgf를 거듭 제곱으로 확장 한 다음 표본 크기가 커짐에 따라 대부분의 항이 중요하지 않음을 나타냅니다.
동일한 함수의 특성 방정식에서 Taylor 확장을 사용하고 샘플 크기를 크게하여 훨씬 적은 라인으로 증명할 수 있습니다.
전산 편의
일부 통계 모델은 오류가 가우스 인 것으로 가정합니다. 이를 통해 카이 제곱 및 F- 분포와 같은 정규 변수의 함수 분포를 가설 검정에 사용할 수 있습니다. 구체적으로, F- 검정에서 F 통계량은 카이 제곱 분포의 비율로 구성되며, 이는 정규 분산 변수의 함수입니다. 이 둘의 비율은 분산이 상쇄되도록하여 정규성과 불변성을 제외하고 분산에 대한 지식없이 가설 검정을 가능하게합니다.