미국 인구 조사 데이터와 같은 통계 목적으로 누적 된 모든 데이터 세트에는 합계 및 집계가 필요한 정보가 포함됩니다. 예를 들어 개인 소득 및 가족 규모와 같은 속성을 나열하는 것은 거의 불가능합니다. 통계학자는 빈도 분포 그래프를 사용하여 포괄적 인 방식으로 데이터를 묘사합니다. 예를 들어, 히스토그램은 데이터를 클래스 간격으로 나누고 해당 클래스 간격에 속하는 모든 멤버가 발생하는 빈도를 계산합니다.클래스 간격의 크기와 수를 계산하는 방법에 대한 엄격한 규칙은 없지만 유용한 기존 기준이 있습니다.
데이터 범위, 즉 최고 및 최저 데이터 포인트 간의 차이를 계산하십시오. 예를 들어, 미국에서 가장 높은 급여를받는 개인이 연간 300 억 달러를 받고 가장 낮은 급여를 0으로 가정합니다. 범위는 30-0이며 이는 300 억 달러입니다.
표본 크기에서 클래스 수를 결정하십시오. 경험적으로, 5 ~ 7 개의 클래스는 최대 50까지의 샘플 크기, 50과 100 사이의 샘플 크기는 8 ~ 10 개의 클래스, 100과 250과 15, 20 클래스 사이의 샘플 크기는 10 ~ 15 개의 클래스가 사용됩니다. 250보다 큽니다.
다음 공식을 사용하여 클래스 간격을 계산하십시오. 클래스 간격 = 범위 ÷ 클래스 수. 소득 분배 예제에 15 개의 소득 클래스가있는 경우 30 ÷ 15 = 20 억 달러를 계산하십시오. 종종 통계 학자들은 매우 높거나 낮은 수치를 무시하고 중역 주파수에 중점을 둡니다. 이러한 이유로 미국의 소득 분배는 1 만 달러의 더 작은 간격으로 제시되며 특정 클래스보다 일반적으로 백만을 초과하는 소득은 단일 클래스 간격으로 묶습니다.
수업 간격을 계산할 때는 재량을 사용하십시오. 히스토그램과 같은 그래프의 성배는 의미 있고 간단한 방법으로 관련 정보를 전달하는 것입니다. 수업 시간 간격을 선택하여 독자가 관심을 가질만한 정보를 전달하십시오.