Data Science/ML(Machine Learning)

머신러닝을 위한 넘파이(NumPy)와 판다스(pandas)의 중요성
머신러닝을 위한 넘파이와 판다스의 중요성 - 머신러닝 에플리케이션 구현에서 다양한 데이터의 추출/가공/변환이 상당한 영역을 차지하고 데이터 처리 부분은 대부분 넘파이와 판다스의 몫. - 사이킷런이 넘파이 기반에서 작성됐기 때문에, 넘파이의 기본 프레임워크를 이해하지 못하면 사이킷런 역시 실제 구현에서 많은 벽에 부딪힐 수 있음. - 사이킷런은 API 구성이 매우 간결하고 직관적이어서 이를 이용한 개발 또한 상대적으로 쉽지만 넘파이와 판다스 API는 더 방대하기 때문에, 이를 익히는 데 시간이 많이 소모 될 수 있음. 하지만 머신러닝을 위해서 이들을 많은 시간을 들여 전문적으로 공부하는 것은 효율적이지 못함. - 넘파이와 판다스에 대한 기본 프레임워크와 중요 API만 습득하고, 일단 코드와 부딪쳐 가면서 ..

주피터 노트북(Jupyter Notebook) 기본 사용법
주피터 노트북 기본 사용법 - windows10 기준 좌측 하단의 윈도우 탐색기창에 jupyter 검색해서 하단의 사진의 아이콘을 클릭해준다. - 클릭하면 하단의 터미널 창이 뜨고 주피터 노트북이 웹페이지에서 자동으로 실행된다. - 해당 창은 주피터를 실행하는 동안 계속 유지시켜야 한다. 닫지 말 것! - 주피터 jpynb 파일(코드 작성하는 파일)을 만들기 위해서는 하단의 사진 처럼 우측 상단의 New 버튼을 누르고 Python3 버튼을 누른다. - 하단의 새로운 jpynb 파일이 생성되고 새로운 스크립트 창이 실행된다. - ln [ ]: 이하의 공백으로 구성된 라인을 "셀" 이라고 한다. - 셀에 코드를 작성한 후 셀 상단에 ▶Run 버튼을 누르거나 Crtl + Enter 키를 동시에 누르면 셀 단위..

주피터 노트북이란?(Jupyter NoteBook)
주피터 노트북이란? - 주피터 노트북은 대표적인 파이썬 대화형 툴 - 대화형 툴이란 말은 마치 학교에서 선생님이 학생들에게 설명하듯이 프로그래밍과 이에 대한 설명적인 요소를 겹합했다는 의미 - 전체 프로그램에서 특정 코드 영역별로 개별 수행을 지원하므로 영역별로 코드 이해가 매우 명확하게 설명할 수 있음

머신러닝을 위한 준비(패키지 다운): 사이킷런 업그레이드 및 XGBoost와 LightGBM 설치
사이킷런 업그레이드 - 본격적인 머신러닝 학습 이전에 사이킷런 업그레이드부터 수행한다. - 상단 사진처럼 Anaconda Prompt(anaconda3)을 관리자 권한으로 실행한다. - Anaconda Prompt(anaconda3)창에 pip install scikit-learn==1.0.2 를 입력한다. (1.0.2는 버전을 의미하는데 https://scikit-learn.org에 들어가서 최신 버전을 확인 후 해당 버전을 입력한다. - 업데이트 완료 - 상단 사진처럼 주피터 앱에 들어가서 해당 코드를 실행해서 업데이트가 잘 이루어졌는지 확인한다. - 버전은 최신 버전이 업그레이드 될 때마다 바뀐다. XGBoost란? - XGBoosteXtreme Gradient Boosting)는 C++, 자바, ..

파이썬 머신러닝을 위한 S/W 설치 (간단)
파이썬 머신러닝 설치 - 파이썬 머신러닝을 위한 패키지를 설치하는 것보다 쉬운 방법은 anaconda를 이용하는 것. - Individual Edtion을 다운 받아준다. 본인의 OS(mac, windows 등)에 맞게 다운 - 위 사진들 처럼 다운을 받아주면 된다. 간단하쥬? - 이런 식으로 아나콘다가 설치된다. 주피터 노트북을 클릭해보자. - 주피터 노트북의 절대 경로(파일이 저장되는 곳)는 [로컬 디스크C/사용자/본인 PC이름] 이다. - 상단 사진의 우측 하단처럼 버튼을 누르면 아래 사진처럼 새로운 코드 작성창이 생성된다. - 위 사진처럼 머신러닝을 위한 패키지를 아나콘다를 통해 한번에 설치할 수 있다.