전체 글

전체 글

    데이터베이스 기본 용어

    트랜잭션(transaction): 논리적 작업 단위로서 하나의 단위로 처리되어야 하는 분리될 수 없는 연산 그룹 데이터 처리 시스템(Data Processing Sysyem:DPS) 일괄처리시스템(batch processing): 데이터를 수집해서 분류하고 정렬시킨 다으멩 일괄 처리하는 데이터 처리 방법 여러 가지 트랜잭션을 한데 모아 일괄적으로 처리하기 때문에각 트랜잭션 당 처리 비용이 적게 듬. 단위 시간당 처리되는 작업 수가 많아 시스템 성능을 높임 그러나 사용자 측면에서는 데이터가 즉시 처리되지 않기 때문에 대기해야하는 단점 여러 가지 사전 준비 작업을 거쳐야 한다는 단점도 존재 온라인 처리 시스템(on-line processing sysytem): 일괄 처리 방식이 필요로 했던 사전 준비 작업 ..

    [회귀분석] 중회귀분석에서의 적합도와 분산분석

    자유도 부분에서 p는 회귀계수의 개수이고 SSR의 자유도는 SST와 SSE의 차로 구해진다. 딱히 이유는 없다. 예제 적합도 S가 작을 수록 좋다. 자유도로 나눠주는 이유는 SSE는 설명변수의 개수가 증가할수록 감소하기 때문이다. 설명하지 못하는 설명변수가 들어감에도 개수가 늘어난다고 SSE가 감소하면 좋지 않기 때문이다. 따라서 자유도로 나누어주는 것이다. 이에 대한 추가 설명 설명변수가 3개였을 때 100이였는데 2개 추가해서 98.2이면 추가된 설명변수의 영향이 크지 않다는 것. 따라서 추가된 설명변수의 영향을 잘 파악하기 위해 n - p(설명변수의 개수)로 나눠줘야 함. SSE는 변동이 있기 때문에 보정된 결정계수를 이용한다. 예측도 및 F 검정 예제 귀무가설 기각 쿼드라틱 폼(이차형식) 1. 총..

    [회귀분석] R을 이용한 중회귀분석 회귀계수 추정

    rep문 x=1의 값을 dim에 행의 개수만큼 반복해서 생성하라. Sale_data[,-1]은 첫번째 열을 빼라는 의미 cbind는 컬럼으로 묶어라 as.matrix() 는 매트릭스로 변환 colnames() 이름 지정 Sale_data[,1] 첫번째 열만 추출 행렬의 곱은 %*% t() 는 transpose 취하는 것 solve()는 역행렬 구하는 것 lm()함수 이용해서 구하는 게 간단