정렬 된 데이터 세트의 사 분위수는 데이터 세트를 4 개의 동일한 부분으로 나누는 3 개의 값 중 하나입니다. 상위 사 분위수는 가장 높은 값을 가진 모집단의 1/4을 식별합니다. 이 용어는 순수한 통계에 광범위하게 사용되지만 역학과 같은 통계를 사용하는 분야에도 적용됩니다. 사 분위수 값을 선택하기위한 특정 규칙은 없지만 몇 가지 기술이 일반적이지만주의해야합니다.
상위 사 분위수를 공식적으로 정의하십시오. 상위 사 분위수는 제 3 사 분위수라고도하며 종종 Q3으로 지정됩니다. 데이터의 최고 25 %를 최저 75 %에서 분리하므로 75 번째 백분위 수로 식별 될 수도 있습니다.
상위 사 분위수에 정확한 값을 할당 할 때의 문제를 조사하십시오. 이는 모집단의 구성원 수가 4로 나눌 수없는 경우 사 분위수 값을 할당하는 방법에 대한 문제를 중심으로합니다. 예를 들어, 모집단에 5 명의 구성원이있는 경우 모집단의 상위 4 분의 4는 4 번째 구성원을 포함하거나 포함하지 않을 수 있습니다.
백분위 수를 평가하는 일반적인 방법 중 하나를 조사하십시오. 이것은 V = (n + 1) (y / 100)으로 표현 될 수 있으며, 여기서 V는 모집단의 하단 y %를 모집단의 상위 (100-y) %와 구분하는 값입니다. V가 정수이면 값이 V 인 모집단 요소가 상위 범위에 속합니다.
상위 사 분위수에 대해 3 단계에서 제공된 방법을 평가하십시오. 방정식 V = (n + 1) (y / 100)를 고려할 때 우리는 y = 75를 사용합니다. 왜냐하면 상위 사 분위수도 75 번째 백분위 수를 나타 내기 때문입니다. 이것은 우리에게 V = (n + 1) (y / 100) = (n + 1) (75/100) = (n + 1) (3/4) = (3n + 3) / 4를줍니다.
5 명의 모집단에 대한 상위 사 분위를 찾으십시오. V = (3n + 3) / 4 = (3x5 + 3) / 4 = (15 + 3) / 4 = 18/4 = 4.5입니다. 상위 사 분위수는 4.5이므로 인구의 상위 4 분의 4.5에는 순위가 4.5보다 높은 멤버 만 포함됩니다. 따라서이 모집단의 상위 4 분의 1은 3 단계에서 설명한 방법을 사용하는 5 번째 구성원으로 만 구성됩니다.