Top 14 엑셀 다중 회귀 분석 The 94 Top Answers

You are looking for information, articles, knowledge about the topic nail salons open on sunday near me 엑셀 다중 회귀 분석 on Google, you do not find the information you need! Here are the best content compiled and compiled by the Chewathai27.com/to team, along with other related topics such as: 엑셀 다중 회귀 분석 엑셀 다중회귀분석 linest, 엑셀 다중회귀분석 그래프 그리기, 다중회귀분석 예제, r 다중회귀분석, 다중회귀분석 해석, 엑셀회귀분석 베타, 엑셀 단순회귀분석, 엑셀 회귀분석

[다중회귀분석 시작해보기]
  1. 준비 데이터는 알고자 하는 값 Y와, 그 Y에 영향을 주고 있는 여러 변수들 X 데이터를 준비해주시구요 …
  2. 데이터 입력 창이 켜지면, Y축 입력 범위와, X 축 입력 범위를 적는 창이 나와요 🙂 …
  3. 결과 확인 ‘확인’을 누르면 새로운 시트에 이런 결과가 나와요!
  4. 해석

엑셀 데이터분석 #03-1 / 다중회귀분석 [엑셀]
엑셀 데이터분석 #03-1 / 다중회귀분석 [엑셀]


엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함)

  • Article author: ministar.tistory.com
  • Reviews from users: 16953 ⭐ Ratings
  • Top rated: 3.4 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함) Updating …
  • Most searched keywords: Whether you are looking for 엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함) Updating 회귀분석에 대한 이론을 아직 포스팅 하지는 않았지만,, 엑셀로 간단하게 해보고, 해석해보는 방법에 대해서 한 번 알아보도록 하겠습니다. 간단하게 회귀분석은 왜하는 거야? 라는 질문에 답변을 드리자면,, 예를..
  • Table of Contents:

태그

관련글

댓글2

공지사항

최근글

인기글

최근댓글

태그

전체 방문자

엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함)
엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함)

Read More

엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기

  • Article author: loadtoexcelmaster.tistory.com
  • Reviews from users: 21801 ⭐ Ratings
  • Top rated: 3.9 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기 다중 선형 회귀분석(Multiple Linear Regreesion)은 두 개 이상의 원인 변수(Explanatory variable)와 반응 변수(reponsive variable) 사이에 관계를 … …
  • Most searched keywords: Whether you are looking for 엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기 다중 선형 회귀분석(Multiple Linear Regreesion)은 두 개 이상의 원인 변수(Explanatory variable)와 반응 변수(reponsive variable) 사이에 관계를 … 다중 선형 회귀분석(Multiple Linear Regreesion)은 두 개 이상의 원인 변수(Explanatory variable)와 반응 변수(reponsive variable) 사이에 관계를 알아볼 때 사용하는 분석이다. 이번 포스팅에서 엑셀에서..Excel, Data Science, 전기전자, Python 그리고 miscellaneous
  • Table of Contents:

엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기

예시 엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion)하기

티스토리툴바

엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기
엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기

Read More

설찬범의 파라다이스 | 엑셀로 통계하기 24 – 다중회귀분석

  • Article author: schbeom.tistory.com
  • Reviews from users: 44047 ⭐ Ratings
  • Top rated: 4.1 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 설찬범의 파라다이스 | 엑셀로 통계하기 24 – 다중회귀분석 독립변수가 둘 이상인 회귀분석은 다중회귀분석(Multiple regression analysis)입니다. 단순선형회귀를 하던 모험을 떠올려 … …
  • Most searched keywords: Whether you are looking for 설찬범의 파라다이스 | 엑셀로 통계하기 24 – 다중회귀분석 독립변수가 둘 이상인 회귀분석은 다중회귀분석(Multiple regression analysis)입니다. 단순선형회귀를 하던 모험을 떠올려 … 단순선형회귀분석은 독립변수 하나와 종속변수 하나의 관계를 알아내려는 회귀분석이었습니다. 세상은 알다시피 그보다는 복잡하죠. 여러 원인이 모여서 결과를 만듭니다. 독립변수가 여럿인 회귀분석은 이제 ‘..
  • Table of Contents:
설찬범의 파라다이스 | 엑셀로 통계하기 24 - 다중회귀분석
설찬범의 파라다이스 | 엑셀로 통계하기 24 – 다중회귀분석

Read More

엑셀을 사용하여 회귀분석하기

  • Article author: crash-mechanics.blogspot.com
  • Reviews from users: 28223 ⭐ Ratings
  • Top rated: 4.4 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 엑셀을 사용하여 회귀분석하기 엑셀을 활용하면 다중 선형 회귀분석을 쉽게 할 수 있다. 예제를 통하여 알아 본다. [예제] KBL(한국농구리그)의 선수 신체조건과 평균 리바운드 개수가 다음과 같을 … …
  • Most searched keywords: Whether you are looking for 엑셀을 사용하여 회귀분석하기 엑셀을 활용하면 다중 선형 회귀분석을 쉽게 할 수 있다. 예제를 통하여 알아 본다. [예제] KBL(한국농구리그)의 선수 신체조건과 평균 리바운드 개수가 다음과 같을 … 엑셀을 활용한 다중선형회귀분석
  • Table of Contents:
엑셀을 사용하여 회귀분석하기
엑셀을 사용하여 회귀분석하기

Read More

엑셀 회귀분석 해석 :: IT 끄적이기

  • Article author: iyousys.tistory.com
  • Reviews from users: 7938 ⭐ Ratings
  • Top rated: 4.0 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 엑셀 회귀분석 해석 :: IT 끄적이기 지난번에 엑셀로 회귀분석하는 것을 하고 다른 짓을 하느라 잊고 있었는데. 다시 회귀분석할 것이 생겨서 분석의 해석법을 적어 놓고자 한다. …
  • Most searched keywords: Whether you are looking for 엑셀 회귀분석 해석 :: IT 끄적이기 지난번에 엑셀로 회귀분석하는 것을 하고 다른 짓을 하느라 잊고 있었는데. 다시 회귀분석할 것이 생겨서 분석의 해석법을 적어 놓고자 한다. 지난번에 엑셀로 회귀분석하는 것을 하고 다른 짓을 하느라 잊고 있었는데 다시 회귀분석할 것이 생겨서 분석의 해석법을 적어 놓고자 한다. 아래 분석결과 후 중요부분을 빨간색으로 변경해 놓았다. 위와 같이..
  • Table of Contents:

TAG

관련글 관련글 더보기

인기포스트

티스토리툴바

엑셀 회귀분석 해석 :: IT 끄적이기
엑셀 회귀분석 해석 :: IT 끄적이기

Read More

엑셀 다중 회귀 분석

  • Article author: minhyun0821.com
  • Reviews from users: 7402 ⭐ Ratings
  • Top rated: 4.4 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 엑셀 다중 회귀 분석 f비가 1.1이고, 유의한 f가 0.3이라, 귀무가설을 채택로, 운동시간이 비만도에 영향을 미치지 않는다고 할 수 있습니다. 인자가 2개 이상인 다중회귀분석. …
  • Most searched keywords: Whether you are looking for 엑셀 다중 회귀 분석 f비가 1.1이고, 유의한 f가 0.3이라, 귀무가설을 채택로, 운동시간이 비만도에 영향을 미치지 않는다고 할 수 있습니다. 인자가 2개 이상인 다중회귀분석.
  • Table of Contents:
엑셀 다중 회귀 분석
엑셀 다중 회귀 분석

Read More

다중회귀분석에서 데이터 분석관련 해결방법 – 오빠두엑셀

  • Article author: www.oppadu.com
  • Reviews from users: 2248 ⭐ Ratings
  • Top rated: 3.4 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 다중회귀분석에서 데이터 분석관련 해결방법 – 오빠두엑셀 다중회귀분석을 하고 있는 도중에 p값과 f값을 해석하고 싶은데 0값이 나와서 문제를 해결하지 못하고 있습니다 통계청에서 가져온 데이터를 더미변수 … …
  • Most searched keywords: Whether you are looking for 다중회귀분석에서 데이터 분석관련 해결방법 – 오빠두엑셀 다중회귀분석을 하고 있는 도중에 p값과 f값을 해석하고 싶은데 0값이 나와서 문제를 해결하지 못하고 있습니다 통계청에서 가져온 데이터를 더미변수 … 다중회귀분석을 하고 있는 도중에 p값과 f값을 해석하고 싶은데 0값이 나와서 문제를 해결하지 못하고 있습니다 통계청에서 가져온 데이터를 더미변수로 변환하는 과정에서 문제가 생긴 것인지 여쭤보고싶습니다.
  • Table of Contents:

회원 자료실

현재 접속자(총 40명)

[Q&A게시판] 0723~0730 댓글순위

홈페이지 검색

다중회귀분석에서 데이터 분석관련 해결방법 - 오빠두엑셀
다중회귀분석에서 데이터 분석관련 해결방법 – 오빠두엑셀

Read More


See more articles in the same category here: Top 673 tips update new.

엑셀로 쉽게 해보는 다중회귀분석 (해석방법포함)

회귀분석에 대한 이론을 아직 포스팅 하지는 않았지만,,

엑셀로 간단하게 해보고, 해석해보는 방법에 대해서 한 번 알아보도록 하겠습니다.

간단하게 회귀분석은 왜하는 거야? 라는 질문에 답변을 드리자면,,

예를 들어, 직장인의 회사생활 만족도에 대한 설문조사를 해보았다고 생각해볼게요.

“현재 당신의 회사생활 만족도는 몇 점인가요?”

저라면,, 점수를 주기 전에

연봉도 생각해보고 나의 동료/상사, 출퇴근 거리 등등을 고려해서 최종 나의 회사생활 만족도 점수를 결정할 것 같아요.

그럼, 추가로 질문 하나 더 !

“우리 회사 직원들의 회사생활 만족도는 어떻게 높일 수 있을까요?”

가장 회사생활 만족도와 연관이 높은 요인을 찾아서, 그 요인을 개선하는게 제일 효과적이지 않을까요?

다중회귀분석은 회사생활만족도(Y)와 인간관계, 출퇴근거리 등과 같은 여러 요인(X)들과의 관계를 분석할 때 사용할 수 있어요.

여러가지로 할 수 있지만, 저는 지금 엑셀로 후다닥 해야하니까 엑셀에서 한번 해볼께요!

[ 준비 과정 ]

1. 엑셀에서 ‘파일’ > ‘옵션’ > ‘추가기능’ 에서 ‘이동’을 클릭해주세요.

2. ‘분석 도구’를 체크하고 확인을 눌러주면 기능을 사용할 준비가 된거예요. 🙂

엑셀 ‘데이터’ 탭에 ‘데이터 분석’ 이 생긴걸 보실 수 있답니다.

[다중회귀분석 시작해보기]

1. 준비

데이터는 알고자 하는 값 Y와, 그 Y에 영향을 주고 있는 여러 변수들 X 데이터를 준비해주시구요

‘데이터분석’에서 ‘회귀분석’을 선택하고, 확인을 눌러주세요.

2. 데이터 입력

창이 켜지면, Y축 입력 범위와, X 축 입력 범위를 적는 창이 나와요 🙂

저는 Y축에는 ‘회사생활 만족도’를 그리고 X 축 범위에는 ‘동료’, ‘회의시간’ 등등 회사생활에 영향을 미치는 변수들을 넣어볼께요.

워,,! 엑셀은 총 16개의 X변수만 입력 받을 수 있네요? ㅠㅠ 젠장,, ㅂㄷㅂㄷ;;

저는 변수가 더 많았지만,, 조금 줄여서 ㅜ_ㅜ 생성해보도록 하겠습니다.

3. 결과 확인

‘확인’을 누르면 새로운 시트에 이런 결과가 나와요!

4. 해석

이제부터 해석을 한번 해보도록 하겠습니다.

* 결정계수 = R Square, 조정된 결정계수 = Adjusted R Square

– 실 세계에서는 Adjusted R^2가 좀 더 가깝다고는 하는데, 통계학자들마다 해석방법이 조금씩 다른것 같아요.

– 보통, 단일 회귀분석에서는 R^2, 다변량 회귀분석에서는 Adjusted R^2가 더 잘 맞는 경향이 있다고 합니다.

– 0.6 (60%) 이상의 값을 가질 때 유의미하다고 봅니다.

– 해석방법은, 본 회귀분석은 이 데이터를 설명하는 설명력이 약 9%정도 반영된 것이라고 보면 됩니다.

* 유의한 F = Significance F

– 0.05보다 클 경우, P-value가 높은 X 변수를 삭제하면서 0.05 미만 값을 충족할 때 까지 회귀분석을 다시 해야해요.

– 해당 값이 0.05보다 작을 경우 대립가설을 채택합니다.

– 대립가설을 채택한다는 말은 -> 회귀계수가 0이 아니다.

-> 독립변수들 중 적어도 하나의 이상의 변수가 종속변수(Y)를 설명하는데 유의하다. 는 뜻입니다.

* P-값 = P-value

– 어떤 독립변수가 종속변수 (Y)를 잘 설명하는지를 나타내요

– p-value > 0.05 일 경우, 귀무가설을 채택합니다. –> 즉, 이 독립변수는 종속변수에 영향을 미치지 않는다.

– p-value < 0.05 일 경우, 대립가설 채택 --> 이 독립변수는 종속변수에 영향을 미친다.

엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion) 하기

다중 선형 회귀분석(Multiple Linear Regreesion)은 두 개 이상의 원인 변수(Explanatory variable)와 반응 변수(reponsive variable) 사이에 관계를 알아볼 때 사용하는 분석이다.

이번 포스팅에서 엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion)을 시행해본다.

만약에 원인 변수(explanatory variable)가 하나가 있다면 선형 회귀분석(simple Linear regression)을 한다.

예시: 엑셀에서 다중 선형회귀분석(Multiple Linear Regreesion)하기

학생들의 공부시간과 지난 기출문제가 시험 성적과 어떤 관계가 있는 파악하고 싶다. 그래서 ‘공부시간’과 ‘기출문제’를 원인 변수(explanatory variable)로, ‘시험 성적’을 반응 변수(reponsive variable)로 해서 다중 선형회귀분석(Multiple Linear Regreesion)을 시행한다.

엑셀에서 아래단계별로 따라가면서 다중 선형회귀분석(Multiple Linear Regreesion)을 한다.

1단계: 데이터 입력

공부시간, 기출문제 수, 시험점수에 데이터를 엑셀에 입력한다.

2단계: 다중 선형회귀분석(Multiple Linear Regreesion) 하기

데이터 > 데이터분석에 들어간다. 데이터 분석 툴이 없다면 업로드한다.

데이터 분석 툴 업로드하기

데이터 분석 창에서 회귀분석을 선택한다.

y축 범위에는 반응 변수(reponsive variable), ‘공부시간’, ‘기출시험 수’를 넣는다. 넣는다. x축 범위에 원인 변수(explanatory variable)를 넣는다. Labels 카네 체크 표시한다. 선택범위에 제목으로 첫 번째 칸은 데이터에서 제외된다. 출력 범위에 임의의 셀을 지정하고 확인을 한다.

아래와 같은 다중 선형 회귀분석(Multiple Linear Regreesion) 결과를 출력받을 수 있다.

3단계: 결과해석하기

이제 주요 결과물들을 하나하나 해석해본다.

결정계수(R²): 0.734, R²라고 쓰고, 결정계수(coefficient of determination)이다. 이 값은 원인 변수(explanatory variable)로 설명 가능한 반응 변수(response variable)의 변동성을 가리킨다 . 예를 들어 지금 예시에서, 73.40%의 ‘시험 성적(y)’에 변동성이 ‘공부 시간(x1)’과 ‘기출문제 수(x2)’로 설명 가능하다. 1로 갈수록 더 정확한 예측이 가능해진다.

표준오차(standard error): 5.366, 이 값은 관측값과 선형 모델 값과의 오차들에 평균이다. 예를 들어, 지금에 선형 모델에서 관측된 시험 점수와 생성된 선형 모델 값 사이에 오차는 평균적으로 5.366 떨어져 있다.

F 비: 23.46, 선형 모델의 F 통계량(F statistics)이다. 회귀 제곱 평균(MSR) / 잔차 제곱 평균(MSE), 675.378 /28.791 = 23.46

Significance F: 0.0000129, F 통계량에 상응하는 p-값(p-value)다. 이 값은 선형 모델이 통계적으로 타당한지 나타낸다. 한 마디로, 원인 변수(explanatory variable)가 반응 변수(reponse variable)와 통계적으로 유의미한 상관성이 있는지 나타낸다. 지금에 예제에서 p-값(p-value)은 0.05보다 작다. 그러므로 ‘공부 시간’, ‘기출문제 수’와 ‘시험 점수’간에는 유의미한 상관관계가 있다.

P-값(P-value): 각 원인 변수(explanatory variable)의 p-value는, 각 원인 변수(explanatory variable)가 통계적으로 타당한지 검정해준다. ‘공부 시간’에 대한 p-값(p-value)은 0.00001로 유의 수준 알파 값: 0.05보다 작으므로 유의미한 지표다. 그에 반해, ‘기출문제 수’에 대한 p-값(p-value)은 0.52로 0.05보다 크기 때문에 통계적으로 유의미한 지표가 아니다. 그래서 ‘기출문제 수’를 원인 변수(explanatory variable)에서 제외하는 것이 타당하다.

계수(Coefficients): 계수는 선형 모델링을 위한 방정식에 필요한 계수를 제공한다. 지금에 예제에서 선형 모델에 값은

시험 점수 = 67.67 + 5.5557*(공부시간)

시험 성적은 공부시간당 평균 5.5557점씩 증가한다. 그리고 선형 모델에서 ‘공부 시간’이 0시간으로 갈 때 받게 될 최저 시험 점수는 67.67점이다. 단, 여기서 ‘기출문제(x2)’는 고정되었다고 가정한다. 예를 들어 A, B 모두 동일한 숫자에 기출문제를 풀었고 그리고 A가 B보다 한 시간 더 공부했다면, A는 5.5557 높은 점수를 받을 것이다.

다중 선형 회귀분석(Multiple Linear Regreesion)로 선형회귀 방정식: 두 개의 계수(coefficient)를 모두 이용해서 다중 회귀모형의 방정식을 만들 수 있다.

시험 점수 = 67.67 + 5.56*(공부시간) – 0.60*(기출문제 수)

그리고 회귀모형 방정식을 이용해서, 한 학생이 공부시간과 기출문제 수를 가지고 받을 시험 점수를 예측할 수 있다. 예를 들어, ‘공부 시간 = 3시간’, ‘기출문제 수 = 1’ 였다면 예상되는 시험 점수는 83.75다.

시험 점수 = 67.67 + 5.56*(3) – 0.60*(1) = 83.75

하지만 ‘기출문제 수(x2)’는 통계적으로 유의미한 변수가 아니었기 때문에 회귀모형 방정식에 추가된다고 해서 추정 값에 정확도가 증가하진 않는다. 이경우, ‘공부 시간’을 단일 변수로 단순 선형 회귀분석(simple Linear Regreesion)을 할 수 있다.

엑셀로 통계하기 24 – 다중회귀분석

반응형

단순선형회귀분석은 독립변수 하나와 종속변수 하나의 관계를 알아내려는 회귀분석이었습니다. 세상은 알다시피 그보다는 복잡하죠. 여러 원인이 모여서 결과를 만듭니다. 독립변수가 여럿인 회귀분석은 이제 ‘단순’하지 않습니다. 독립변수가 둘 이상인 회귀분석은 다중회귀분석(Multiple regression analysis)입니다.

단순선형회귀를 하던 모험을 떠올려 봅시다. 먼저 회귀모형을 만들었습니다. 오차항은 기댓값이 0인 정규분포였죠. 여기에 기댓값을 씌워 E(y)를 구하는 회귀식을 만듭니다. 이 회귀식은 모집단을 알아야 만들 수 있어서, 표본밖에 없는 우리는 하릴없이 추정회귀식으로 회귀식을 추정했습니다.

다중회귀분석도 과정은 같습니다. 오차항이 있는 다중회귀모형(Multiple regression model). y의 기댓값을 구하는 다중회귀식(Multiple regression equation). 표본으로 추정한 추정 다중회귀식(Estimated multiple regression equation).

이번에도 최소제곱법

그럼 추정 다중회귀식에서 b는 어떻게 구할까요? 여러 방법이 있지만 최소제곱법(최소자승법)이 일반적입니다. 단순선형회귀는 최소제곱법으로 구하는 y절편과 x기울기 공식이 있어서 구하기 쉽습니다. 다중회귀분석은 독립변수가 여럿이라 구하기가 어렵습니다. 독립변수가 셋만 되어도 사람 손으로는 불가능할 정도죠. 훗날 다중회귀 최소제곱법을 포스팅할지도 모르겠네요.

엑셀로 다중회귀식 구하기

[데이터 분석] – [회귀분석]에 들어갑니다.

방법은 단순선형회귀분석과 같습니다. ‘X축 입력 범위’에 여러 열 범위를 입력하면 됩니다.

다중결정계수

단순선형회귀에서 모든 추정값을 y의 평균으로 추정한 영희가 있었습니다. 영희의 오차는 회귀식과 영희의 격차와 회귀식의 오차의 합입니다. 총제곱합은 회귀제곱합과 오차제곱합의 합이죠.(단순선형회귀 1 참고)

SST = SSR + SSE

SST에서 SSR이 차지하는 비율을 결정계수라고 불렀습니다. 결정계수의 최댓값은 1이고 결정계수가 높을수록 추정회귀식이 적합하다고 간주합니다.

다중회귀분석도 결정계수는 똑같습니다. 다만 다중결정계수(Multiple coefficient of determination)라고 불릴 뿐입니다.

조정 다중결정계수

그런데 결정계수가 늘 적합성을 잘 반영하지는 않습니다. 예를 들어 기말고사 점수가 종속변수고 공부 시간이 독립변수인 자료가 있습니다. 여기에 두 번째 독립변수로 아무 숫자나 무작위로 넣습니다. 엑셀 난수 생성 함수 RAND를 이용합니다.

분명 기말고사 점수와 아무 상관이 없는 무작위 숫자를 넣었는데도 다중결정계수가 상승합니다. 독립변수가 늘어나면 통계적으로 유의하지 않아도 결정계수가 올라갈 수 있습니다. 이걸 고려한 결정계수가 바로 조정 다중결정계수(Adjusted multiple coefficient of determination)입니다.

p : 독립변수의 수

엑셀에서 다중결정계수 구하기

[데이터 분석] – [회귀분석]을 실시하면 결정계수와 조정된 결정계수가 나옵니다.

유의성 검정

다중회귀분석도 유의성을 검정합니다. 검정법에는 F검정과 t검정이 있다고 배웠습니다. 단순선형회귀는 F검정과 t검정 결과가 똑같습니다. 다중회귀분석은 두 검정 결과가 다릅니다. 애초에 목적과 대상이 다릅니다.

F검정은 독립변수 집합과 종속변수가 유의한 관계인지 검정합니다(전반적 유의성 검정). t검정은 각 독립변수가 종속변수와 유의한지 검정합니다(개별적 유의성 검정). F검정은 자료 당 한 번이고 t검정은 독립변수 수만큼 결과가 나옵니다.

F검정

1) 귀무가설과 대립가설을 세우고 유의수준을 정합니다.

2) 평균제곱회귀(MSR)을 구합니다. SSR을 독립변수 수로 나눈 값입니다.

3) 평균제곱오차(MSE)를 구합니다. SSE를 n-p-1로 나눈 값입니다.

4) MSR/MSE=F비를 구합니다.

5) 자유도가 p, n-p-1인 F분포에서 F비 오른쪽 날개의 면적을 구합니다. 날개 면적이 p값이고, p값이 유의수준보다 낮으면 귀무가설을 기각합니다.

t검정

1) 한 독립변수에 대한 귀무가설과 대립가설을 세우고 유의수준을 정합니다.

2) 그 독립변수의 표준오차를 구합니다. MSE의 제곱근입니다.

3) 검정통계량 t값을 구합니다. 계수를 표준오차로 나눈 값입니다.

4) 자유도가 n-p-1인 t분포에서 t값보다 절댓값이 큰 양날개의 면적이 p값입니다. p값이 유의수준보다 낮으면 귀무가설을 기각합니다.

단순선형회귀(2) 참고

엑셀에서 다중회귀분석 F검정,t검정 하기

[데이터 분석] – [회귀분석]에서 유의수준을 입력하고 시행하면 결과에서 F검정 p값과 독립변수별 t검정 p값을 볼 수 있습니다.

다중공선성

회귀분석은 독립변수와 회귀변수 사이 관계를 알아냅니다. 그런데 독립변수 사이에도 관계가 있을 수 있습니다. 예를 들어 종속변수가 택배 배송 비용, 독립변수가 배송 거리와 연료비인 회귀분석이 있다고 합시다. 배송 거리가 멀수록 연료비는 자연히 상승합니다. 배송 거리와 연료비는 강한 상관관계가 있습니다.

상관관계가 강하다면 굳이 독립변수를 추가할 필요가 없습니다. 배송 거리를 알면 연료비도 알 텐데 연료비를 독립변수로 추가해 봐야 얼마나 더 정확해질까요.

게다가 상관성이 강한 독립변수가 추가되면 한 독립변수가 종속변수에 미치는 영향을 따로 떼어 구분하기 어렵습니다. t검정을 해서 한 독립변수의 계수가 0이라는 귀무가설을 기각하지 못하게 되었다고 생각해 봅시다. 물론 이 독립변수가 종속변수와 무관해서 귀무가설이 기각되지 않았을 수 있습니다. 그러나 이 독립변수와 상관성이 강한 다른 독립변수 때문일 수도 있습니다.

이렇게 독립변수 사이 상관관계에 따른 문제를 다중공선성(Multicollinearity)라고 부릅니다.

그럼 다중공선성은 어떻게 알아낼까요. 두 변수 사이 상관성을 구하는 법으로 상관계수가 있습니다. 공분산을 각자의 표준편차로 나눈 값입니다. 이 상관계수 절댓값이 0.7을 넘으면 다중공선성이 잠재적 문제라고 판단하는 기준이 있습니다.

반응형

So you have finished reading the 엑셀 다중 회귀 분석 topic article, if you find this article useful, please share it. Thank you very much. See more: 엑셀 다중회귀분석 linest, 엑셀 다중회귀분석 그래프 그리기, 다중회귀분석 예제, r 다중회귀분석, 다중회귀분석 해석, 엑셀회귀분석 베타, 엑셀 단순회귀분석, 엑셀 회귀분석

Leave a Comment