통계에 따르면 모집단의 데이터를 임의로 샘플링하면 평균이 종의 피크를 중심으로 종 모양의 곡선이 생성됩니다. 이것을 정규 분포라고합니다. 중심 한계 정리는 표본의 수가 증가함에 따라 측정 된 평균이 모집단 평균에 대해 정규적으로 분포되는 경향이 있고 표준 편차가 더 좁아 진다고 말합니다. 중심 한계 정리는 모집단 내에서 특정 값을 찾을 확률을 추정하는 데 사용할 수 있습니다.
샘플을 수집 한 다음 평균을 결정하십시오. 예를 들어 미국의 남성이 데시 리터당 콜레스테롤 수치가 230 밀리그램 이상일 확률을 계산한다고 가정합니다. 우리는 25 명의 개인으로부터 샘플을 수집하고 그들의 콜레스테롤 수치를 측정하는 것으로 시작할 것입니다. 데이터를 수집 한 후 샘플의 평균을 계산하십시오. 평균은 각 측정 값을 합산하고 총 샘플 수로 나누어서 구합니다. 이 예에서는 평균이 데시 리터당 211 밀리그램이라고 가정합니다.
데이터 "확산"의 척도 인 표준 편차를 계산합니다. 몇 가지 간단한 단계로 수행 할 수 있습니다.
이 예에서는 표준 편차가 데시 리터당 46 밀리그램이라고 가정합니다.
표준 편차를 총 표본 수의 제곱근으로 나누어 표준 오차를 계산하십시오.
표준 오차 = 46 / sqrt25 = 9.2
정규 분포와 음영의 스케치를 적절한 확률로 그립니다. 이 예에 따르면 수컷이 데시 리터당 230 밀리그램 이상의 콜레스테롤 수치를 가질 확률을 알고 싶습니다. 확률을 구하려면 데시 리터당 평균 230 밀리그램에서 몇 개의 표준 오류 (Z- 값)가 떨어져 있는지 확인하십시오.
Z = 230-211 / 9.2 = 2.07
평균보다 높은 2.07 표준 오차를 얻을 확률을 찾으십시오. 평균의 2.07 표준 편차 내에서 값을 찾을 확률을 찾아야하는 경우 z는 양수입니다. 평균의 2.07 표준 편차를 초과하는 값을 찾을 확률을 찾으려면 z는 음수입니다.
표준 정규 확률 테이블에서 z- 값을 찾습니다. 왼쪽의 첫 번째 열은 z 값의 정수와 소수점 첫째 자리를 보여줍니다. 상단의 행은 z- 값의 소수점 세 번째 자리를 표시합니다. 예를 들어, z- 값이 -2.07이므로 먼저 왼쪽 열에서 -2.0을 찾은 다음 맨 위 행에서 0.07 항목을 스캔하십시오. 이 열과 행이 교차하는 지점은 확률입니다. 이 경우, 표에서 읽은 값은 0.0192이므로 데시 리터당 230 밀리그램 이상의 콜레스테롤 수치를 가진 남성을 찾을 확률은 1.92 %입니다.