Data Science/ML(Machine Learning)

    통계 분석에 있어서 R과 Python 비교 및 차이

    R과 Python 비교 - R은 통계 전용 프로그램 언어로서 SPSS, SAS, MATLAB 등 전통적인 통계 및 마이닝 패키지의 고비용의 문제를 해결하기 위해 통계 전문가들이 만든 언어이다. - Python(파이썬)은 직관적인 문법과 객체지향과 함수형 프로그래밍 모두를 포괄하는 유연한 프로그램 아키텍쳐, 다양한 라이브러리 등의 큰 강점을 가지면서 프로그래밍 세계에서 주류를 향해 가고 있는 언어이다. - 개발 언어에 익숙하지 않으나 통계 분석에 능한 현업 사용자라면 R로 머신러닝을 접하는 것이 더 쉽고 유용할 수 있다. 파이썬도 굉장히 직관적인 언어지만, R의 경우 통계 분석을 위해 특화된 언어이며 무엇보다도 오랜 기간 동안 많은 R 사용자들이 생성하고 검증해온 다양하고 많은 통계 패키지를 보유하고 있는..

    머신러닝 유형 및 단점

    머신러닝 유형 - 머신러닝은 지도 학습(Supervised Learning), 비지도 학습(Un-supervised Learning), 강화 학습(Reinforcement Learning)으로 나뉜다. - 지도 학습은 답(Label, Target)이 학습 과정에서 주어지고 비지도 학습은 문제(Feature)값만 학습 과정에서 주어진다. 머신러닝 알고리즘 종류 머신러닝 단점 - 데이터에 너무 의존적 (Garbage in , Garbage Out) - 좋지 않은 데이터를 투입시 좋지 않은 결과가 도출된다. - 학습 환경에서 최적의 결과를 도출하기 위해 수립된 머신러닝 모델은 실제 환경에서 데이터 적용시 과적합(Oveflow)가 일어날 가능성이 높다. - 복잡한 머신러닝 알고리즘으로 인해 도출된 결과를 논리적..

    머신러닝(ML)의 개념

    머신러닝의 개념 - 머신러닝이란 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭 - 현실 세계의 매우 복잡한 조건으로 인해 기존의 소프트웨어 코드만으로는 해결하기 어려웠던 많은 문제점들을 이제 머신러닝을 이용해 해결 가능 - 데이터마이닝, 영상인식, 음성인식, 자연어 처리에 머신러닝을 적용하면서 급속하게 발전 머신러닝은 왜 필요한가? - 현실 세계의 복잡한 업무와 규칙을 구현하기 위한 매우 복잡하고 방대한 코드 문제 - 수시로 변하는 업무 환경, 정책, 사용자 성향에 따른 애플리케이션 구현 어려움 - 많은 자원과 비용을 통해서 구현된 애플리케이션 정확성 문제 - 여러 특징(feature)을 조건문으로만 구분하여 숫자를 인식하는 등 여러 특징을 다 고려..