콘텐츠
통계에서 분산 분석 (ANOVA)은 서로 다른 데이터 그룹을 함께 분석하여 서로 관련이 있는지 또는 유사한지를 확인하는 방법입니다. ANOVA 내에서 중요한 테스트 중 하나는 MSE (root mean square error)입니다. 이 수량은 통계 모델에 의해 예측 된 값과 실제 시스템의 측정 값 사이의 차이를 추정하는 방법입니다. 루트 MSE 계산은 몇 가지 간단한 단계로 수행 할 수 있습니다.
제곱 오류의 합 (SSE)
각 데이터 세트 그룹의 전체 평균을 계산하십시오. 예를 들어, 집합 A와 집합 B의 두 데이터 그룹이 있다고 가정합니다. 여기서 집합 A에는 숫자 1, 2 및 3이 있고 집합 B에는 숫자 4, 5 및 6이 있습니다. 집합 A의 평균은 2입니다. 1, 2 및 3을 더하고 3으로 나눔)과 세트 B의 평균은 5입니다 (4, 5 및 6을 더하고 3으로 나눔).
개별 데이터 포인트에서 데이터의 평균을 빼고 다음 값을 제곱합니다. 예를 들어, 데이터 세트 A에서 2를 평균으로 1을 빼면 값이 -1이됩니다. 이 숫자를 제곱하면 (즉, 자체에 곱하면) 1이됩니다. 세트 A의 나머지 데이터에 대해이 프로세스를 반복하면 0과 1이되고 세트 B의 경우 숫자도 1, 0 및 1입니다. .
모든 제곱 값을 요약하십시오. 이전 예제에서 모든 제곱 수를 합하면 숫자 4가 생성됩니다.
분산 분석에서 근본 MSE 계산
처리 할 자유도 (데이터 세트 수)로 총 데이터 포인트 수를 빼서 오차 자유도를 찾으십시오. 이 예에는 총 6 개의 데이터 포인트와 2 개의 서로 다른 데이터 세트가 있으며, 이는 오류의 자유도를 4로 지정합니다.
제곱 오차의 오차를 오차의 자유 도로 나눕니다. 예를 계속하면 4를 4로 나누면 1이됩니다. 이것은 평균 제곱 오차 (MSE)입니다.
MSE의 제곱근을 취하십시오. 예제를 마치면 1의 제곱근은 1입니다. 따라서이 예제에서 ANOVA의 루트 MSE는 1입니다.