콘텐츠
수학적 용어로 "평균"은 평균입니다. 데이터 세트를 의미있게 나타내도록 평균이 계산됩니다. 예를 들어 기상학자는 1 월 22 일 시카고의 평균 온도가 과거 데이터를 기준으로 화씨 25 도라고 말할 수 있습니다. 이 숫자는 다음 1 월 22 일 시카고의 정확한 온도를 예측할 수 없지만, 그 날짜에 시카고에 갈 경우 재킷을 포장해야한다는 것을 충분히 알 수 있습니다. 일반적으로 사용되는 두 가지 방법은 산술 평균과 기하 평균입니다. 데이터에 사용할 것을 아는 것은 차이점을 이해하는 것을 의미합니다.
계산 공식
데이터 세트의 산술 평균과 기하 평균의 가장 분명한 차이점은 계산 방법입니다. 산술 평균은 데이터 세트의 모든 숫자를 더하고 결과를 총 데이터 포인트 수로 나누어 계산합니다.
예 : 11, 13, 17 및 1,000의 산술 평균 = (11 + 13 + 17 + 1,000) / 4 = 260.25
데이터 세트의 기하 평균은 데이터 세트의 숫자에 곱하고 결과의 n 번째 근을 취하여 계산됩니다. 여기서 "n"은 세트의 총 데이터 포인트 수입니다.
예 : 기하 평균 11, 13, 17 및 1,000 = 4의 근 (11 x 13 x 17 x 1,000) = 39.5
특이 치의 영향
산술 평균 및 기하 평균 계산 결과를 보면 특이 치의 영향이 기하 평균에서 크게 약화되는 것을 알 수 있습니다. 이것은 무엇을 의미 하는가? 11, 13, 17 및 1,000의 데이터 세트에서 값 1,000은 다른 모든 값보다 훨씬 높기 때문에 "이상 값"이라고합니다. 산술 평균을 계산할 때 결과는 260.25입니다. 데이터 세트의 숫자가 260.25에 가깝지 않으므로이 경우 산술 평균이 대표적이지 않습니다. 특이 치 효과가 과장되었습니다. 39.5의 기하 평균은 데이터 세트의 대부분의 숫자가 0-50 범위 내에 있음을 더 잘 보여줍니다.
용도
통계학자는 산술 수단을 사용하여 유의 한 특이 치가없는 데이터를 나타냅니다. 시카고에서 1 월 22 일의 모든 온도는 -50에서 50도 사이이므로이 유형의 평균은 평균 온도를 나타내는 데 좋습니다. 10,000 도의 온도는 발생하지 않습니다. 타격 평균 및 평균 레이싱 카 속도와 같은 것들도 산술 수단을 사용하여 잘 표현됩니다.
데이터 포인트 간의 차이가 로그이거나 10의 배수로 변하는 경우 기하 평균이 사용됩니다. 생물 학자들은 기하 평균을 사용하여 박테리아 개체군의 크기를 설명합니다. 경제학자들은 기하학적 분포를 사용하여 소득 분포를 설명 할 수 있습니다. 당신과 대부분의 이웃은 매년 약 65,000 달러를 벌 수 있지만 언덕에있는 사람이 연간 6 천 5 백만 달러를 벌면 어떻게 될까요? 인근 소득의 산술 평균이 여기에서 오도 될 수 있으므로 기하 평균이 더 적합합니다.