부터 재생01:18
β1(hat)에 대한 분포
w_i는 상수, Y_i는 정규분포를 따른다.
but 시그마를 모르기 때문에 s로 대체 후 t분포 이용
자유도는 n-2
부터 재생03:18
β0(hat)에 대한 분포
w_i는 상수, Y_i는 정규분포를 따른다.
but 시그마를 모르기 때문에 s로 대체 후 t분포 이용
자유도는 n-2
부터 재생04:38
예시 회귀기울기 β1에 대한 추론 및 가설검정
검정결과 통계적으로 유용하다.
부터 재생07:49
예시 회귀기울기 β0에 대한 추론 및 가설검정
검정결과 통계적으로 유의하지 않다.
부터 재생10:26
부터 재생11:31
β0,β1에 대한 추정량 hat을 이용하면 점추정량 구할 수 있고ㅂ
분산의 경우 해당 공식이 나오는 이유는 다음과 같다.
부터 재생12:30
증명
x는 상수 β0 (hat), β1 (hat)들이 변수
부터 재생13:56
Y_1, Y_2 등 Y값들은 서로 독립이라 다른 것들은 COV는 0
W는 상수
W는 이전에 치환한 값
부터 재생16:02
부터 재생17:55
구한 것들을 대입해서 확인
부터 재생18:52
분산을 구했고 시그마 제곱을 모르니 S로 대체
S는 t분포를 따른다.
부터 재생20:02
예측(not 추정)
부터 재생20:43
예측을 통한 Y값 과 Y(hat)은 새로운 값이기 때문에 서로 독립적인 관계이다. 따라서 cov는 0이다.
부터 재생23:00
1+가 추가 된다는 것이 다른 점
부터 재생23:25
신뢰구간과 예측구간은 다르다. 예측 구간의 폭이 더 넓다.
부터 재생24:52
예측구간과 신뢰구간의 관계를 비교
점선이 예측구간, 실선이 신뢰구간
시그마 제곱을 예측구간에서는 고려하기 때문에 더 넓은 형태를 띄게 됨
부터 재생25:46
예제
기온이 25도일 때 아이스크림 판매량의 평균은 95퍼센트 신뢰수준으로 20.66과 27.05 수준에 포함될 것이라고 해석 가능
부터 재생28:26
예제
예측 구간은 더 넓다.
부터 재생30:26
잔차분석(중요)
부터 재생32:04
가정의 타당성 조사
x축에 대해 y(hat)을 넣으면 잔차와 예측값 사이에 산점도를 알 수 있어서 세번째 가정을 설명할 수 있다.
x축에 대해 설명변수를 넣으면 첫번째, 여섯번째 가정에 대해 설명 가능. 0을 중심으로 랜덤하게 퍼져있기 때문
x축에 대해 i를 넣으면 잔차의 독립성 정규성 평균 0들을 알 수 있다.
Q-Q plot
quantile 백분위수, 정규분포의 분위수(%)
표준화 부분 증명
앞에서 증명된 것들 많아서 이용.
빨간색 글씨 부분은 앞에서 증명했던 것들 참고
잔차도
정확한 경우
등분산 경우를 벗어났을 때
선형성이 아닐 때
아이스크림 예제를 통한 잔차도
어느정도 퍼져야 등분산도를 만족하지 않는가? -2와 +2를 벗어나게 되면 틔는 값.
'Math > 회귀분석' 카테고리의 다른 글
[회귀분석] 다중선형회귀분석1 (0) | 2023.03.27 |
---|---|
[회귀분석] R를 이용한 회귀계수 추정 (0) | 2023.03.26 |
[회귀분석] R실습 (0) | 2023.03.19 |
[회귀분석] 단순선형회귀분석2 (0) | 2023.03.19 |
[회귀분석] 단순선형회귀분석1 (0) | 2023.03.18 |