분류 전체보기

[회귀분석] 회귀모형의 진단과 수정 -1
부터 재생00:59 부터 재생03:37 부분적으로 회귀 검정을 할 수 있다. SST는 완전모형이나 축소모형이나 동일하다. SST에는 회귀식이 들어있지 않기 때문이다. 부터 재생09:06 Bold 글씨체는 벡터다! scalar와 구별 잘하기 축소한 모형과 완전 모형을 비교해서 축소 모형의 큰 차이가 없으면 축소 모형을 선택하면 된다. 부터 재생13:12 설명변수가 많은 수록 y의 fitting 값이 y에 가까워 진다. (Y(hat)의 식만 봐도 알 수 있죠) 따라서 full model의 SSE가 더 작고 SSR이 크다. 두 모형의 SSE, SSR의 차이를 비교하면 된다. 부터 재생19:07 예제 부터 재생21:51 부터 재생23:56 H0를 기각할 수 없다. 즉 필요 없는 변수라는 것(귀무가설 기각 못함 ..

[회귀분석] R을 이용한 다중선형회귀분석2 (적합도와 분산분석, 추론)
F검정 lower.tail이 F면 태일을 남기지 않고 태일인 곳? 이라 생각 anova(model)을 이용할 때 x1, x2에 따른 각각의 SSR이 나오기 때문에 합해야지 전체 SSR이 된다. Sum sq부분이 SSR 부분 MSR도 마찬가지 F value가 각각 나오는 곳은 합하면 안된다. MSR/MSE로 직접 구하기 summary(model)은 Estimate는 추정값 b(hat) std error은 b(hat)의 표준에러 F value도 나온다. 보통 회귀식을 세우고 summary함수 이용 예제 diag()는 대각 원소들만 뽑아서 행하나 만듬 coef_mat[,1]은 첫번째 열만 뽑아옴 베타2만 귀무가설 기각을 하지 못함. 예제 (2) 신뢰구간 confint(model)로 신뢰구간 구할 수 있다. 예..

[데이터 베이스] 데이터베이스 및 DBMS 정의
데이터베이스(Database) 정의 데이터베이스(Database)란, 체계화된 데이터의 모음으로서 여러 사용자들이 공유하여 사용할 수 있도록 구성한 데이터의 집합을 의미합니다. 또한, 보조 저장 장치(Disk)에 저장됩니다. 보다 구체적으로는, 데이터베이스는 여러 개체(Entity)나 속성(Attribute)들 간의 상호 관계를 기록하고, 이를 관리하는 컴퓨터 기반 시스템을 말합니다. 이를 통해 사용자들은 중복되는 데이터를 방지하고, 데이터의 무결성(Integrity)과 일관성(Consistency)을 유지하면서 보다 효율적으로 데이터를 검색하고 조작할 수 있습니다. 데이터베이스는 일반적으로 구조화된 쿼리 언어(SQL)를 사용하여 데이터를 검색하고 조작하며, 대규모 데이터를 처리하고 저장할 수 있습니다...
데이터베이스 기본 용어
트랜잭션(transaction): 논리적 작업 단위로서 하나의 단위로 처리되어야 하는 분리될 수 없는 연산 그룹 데이터 처리 시스템(Data Processing Sysyem:DPS) 일괄처리시스템(batch processing): 데이터를 수집해서 분류하고 정렬시킨 다으멩 일괄 처리하는 데이터 처리 방법 여러 가지 트랜잭션을 한데 모아 일괄적으로 처리하기 때문에각 트랜잭션 당 처리 비용이 적게 듬. 단위 시간당 처리되는 작업 수가 많아 시스템 성능을 높임 그러나 사용자 측면에서는 데이터가 즉시 처리되지 않기 때문에 대기해야하는 단점 여러 가지 사전 준비 작업을 거쳐야 한다는 단점도 존재 온라인 처리 시스템(on-line processing sysytem): 일괄 처리 방식이 필요로 했던 사전 준비 작업 ..

[회귀분석] 중회귀분석에서의 적합도와 분산분석
자유도 부분에서 p는 회귀계수의 개수이고 SSR의 자유도는 SST와 SSE의 차로 구해진다. 딱히 이유는 없다. 예제 적합도 S가 작을 수록 좋다. 자유도로 나눠주는 이유는 SSE는 설명변수의 개수가 증가할수록 감소하기 때문이다. 설명하지 못하는 설명변수가 들어감에도 개수가 늘어난다고 SSE가 감소하면 좋지 않기 때문이다. 따라서 자유도로 나누어주는 것이다. 이에 대한 추가 설명 설명변수가 3개였을 때 100이였는데 2개 추가해서 98.2이면 추가된 설명변수의 영향이 크지 않다는 것. 따라서 추가된 설명변수의 영향을 잘 파악하기 위해 n - p(설명변수의 개수)로 나눠줘야 함. SSE는 변동이 있기 때문에 보정된 결정계수를 이용한다. 예측도 및 F 검정 예제 귀무가설 기각 쿼드라틱 폼(이차형식) 1. 총..