콘텐츠
공학 또는 과학 분석을위한 가장 기본적인 도구 중 하나는 선형 회귀입니다. 이 기술은 두 변수로 된 데이터 세트로 시작합니다. 독립 변수는 일반적으로 "x"라고하며 종속 변수는 일반적으로 "y"라고합니다. 이 기술의 목표는 데이터 세트에 가까운 선 y = mx + b를 식별하는 것입니다. 이 추세선은 종속 변수와 독립 변수 사이의 관계를 그래픽 및 수치로 표시 할 수 있습니다. 이 회귀 분석에서 상관 관계 값도 계산됩니다.
데이터 포인트의 x 및 y 값을 식별하고 구분하십시오. 스프레드 시트를 사용하는 경우 인접한 열에 입력하십시오. 같은 수의 x 및 y 값이 있어야합니다. 그렇지 않으면 계산이 정확하지 않거나 스프레드 시트 함수가 오류를 반환합니다. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
모든 값의 합을 세트의 총 값 수로 나누어 x 값과 y 값의 평균값을 계산하십시오. 이 평균을 "x_avg"및 y_avg라고합니다. x_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
각 x 값에서 x_avg 값과 각 y 값에서 y_avg 값을 빼서 두 개의 새 데이터 세트를 작성하십시오. x1 = (6-6, 5-6, 11-6, 7-6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2-5, 3-5, 9-5, 1-5, ...) y1 = (-3, -2, 4, -4, 3, 2, 0)
각 x1 값에 각 y1 값을 차례로 곱하십시오. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
각 x1 값을 제곱합니다. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
x1y1 값과 x1 ^ 2 값의 합을 계산하십시오. sum_x1y1 = 0 + 2 + 20-4-4-4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
회귀 계수를 구하려면 "sum_x1y1"을 "sum_x1 ^ 2"로 나눕니다. sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0.306