콘텐츠
사 분위수 범위는 종종 IQR로 약칭되며, 주어진 데이터 세트의 25 번째 백분위 수에서 75 번째 백분위 수 또는 중간 50 %의 범위를 나타냅니다. 사 분위수 범위는 테스트의 평균 성과 범위를 결정하는 데 사용될 수 있습니다. 특정 테스트에서 대부분의 사람들이 점수를 얻는 위치를 확인하거나 회사의 평균 직원이 매월 얼마나 많은 돈을 벌는지 결정하는 데 사용할 수 있습니다 . 사 분위수 범위는 단일 숫자가 아닌 분산 범위를 식별 할 수 있기 때문에 데이터 세트의 평균 또는 중앙값보다 효과적인 데이터 분석 도구가 될 수 있습니다.
TL; DR (너무 길고 읽지 않음)
사 분위 범위 (IQR)는 데이터 세트의 중간 50 %를 나타냅니다. 이를 계산하려면 먼저 데이터 포인트를 최소에서 최대로 정렬 한 다음 공식 (N + 1) / 4 및 3 * (N + 1) / 4를 사용하여 첫 번째 사 분위수와 세 번째 사 분위수 위치를 결정하십시오. 여기서 N은 숫자입니다 데이터 세트의 포인트. 마지막으로, 데이터 세트의 사 분위수 범위를 결정하기 위해 세 번째 사 분위수에서 첫 번째 사 분위수를 빼십시오.
주문 데이터 포인트
사 분위수 범위 계산은 간단한 작업이지만 계산하기 전에 데이터 세트의 다양한 지점을 정렬해야합니다. 이렇게하려면 먼저 데이터 포인트를 최소에서 최대로 주문하십시오. 예를 들어 데이터 포인트가 10, 19, 8, 4, 9, 12, 15, 11 및 20 인 경우 {4, 8, 9, 10, 11, 12, 15, 19, 20}. 데이터 포인트가 이와 같이 주문되면 다음 단계로 넘어갈 수 있습니다.
1 사 분위 위치 결정
그런 다음 다음 공식을 사용하여 첫 번째 사 분위수의 위치를 결정하십시오. (N + 1) / 4, 여기서 N은 데이터 세트의 포인트 수입니다. 첫 번째 사 분위수가 두 숫자 사이에 있으면 두 숫자의 평균을 첫 번째 사 분위수 점수로 사용하십시오. 위의 예에서 9 개의 데이터 포인트가 있으므로 1에서 9를 더하여 10을 얻은 다음 4로 나누면 2.5가됩니다. 첫 번째 사 분위수가 두 번째와 세 번째 값 사이에 있기 때문에 평균 8과 9를 취하여 첫 번째 사 분위수 위치는 8.5입니다.
3 분위 위치 결정
첫 번째 사 분위수를 결정했으면 다음 공식을 사용하여 세 번째 사 분위수의 위치를 결정하십시오. 3 * (N + 1) / 4 여기서 N은 다시 데이터 세트의 포인트 수입니다. 마찬가지로 세 번째 사 분위수가 두 숫자 사이에 있으면 첫 번째 사 분위수 점수를 계산할 때처럼 평균을 구하십시오. 위의 예제에서 9 개의 데이터 포인트가 있으므로 1을 9로 더하여 10을 구하고 3을 곱하여 30을 구한 다음 4를 4로 나누어 7.5를 구합니다. 첫 번째 사 분위수는 일곱 번째와 여덟 번째 값 사이에 있으므로 평균 15와 19를 사용하여 세 번째 사 분위수 17을 얻습니다.
사 분위수 범위 계산
첫 번째 사 분위수와 세 번째 사 분위수를 결정했으면 세 번째 사 분위수 값에서 첫 번째 사 분위수 값을 빼서 사 분위수 범위를 계산하십시오. 이 기사에서 사용 된 예제를 마치려면 17에서 8.5를 빼서 데이터 세트의 사 분위수 범위가 8.5와 같다는 것을 알 수 있습니다.
IQR의 장점과 단점
사 분위수 범위는 데이터 세트의 양쪽 끝에서 특이 치를 식별하고 제거 할 수 있다는 이점이 있습니다. 또한 IQR은 왜곡 된 데이터 분포의 경우 변동을 측정하는 데 유용하며 누적 빈도 분포를 사용하여 데이터 포인트를 구성하는 한 IQR을 계산하는이 방법은 그룹화 된 데이터 세트에서 작동 할 수 있습니다. 그룹화 된 데이터에 대한 사 분위수 범위 공식은 그룹화되지 않은 데이터와 동일하며, IQR은 세 번째 사 분위수에서 빼는 첫 번째 사 분위수 값과 같습니다. 그러나 표준 편차와 비교하여 몇 가지 단점이 있습니다. 몇 가지 극한 점수에 대한 민감도가 낮고 표준 편차만큼 강하지 않은 샘플링 안정성입니다.