본문 바로가기

파이썬/파이썬 머신러닝 완벽 가이드

파이썬 기반의 머신러닝과 생태계 이해

반응형

1> 머신러닝 개념

* 머신러닝이란?

애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭한다.

* 머신러닝과 기존 컴퓨터 사이언스의 차이

기존 컴퓨터 사이언스 a + b = a+b

머신러닝 a + b = c

머신러닝은 문제와 답을 주고 규칙을 찾음

2> 머신러닝 유형과 데이터의 중요성

*머신러닝 유형

지도학습(Supervised Learning) - 분류,회귀, 추천시스템, 시각/음성 감지/인지

비지도학습(Un-supervised Learning) - 군집화(클러스터링), 차원 축소, 토픽모델링/문서군집화

강화학습(Reinforcement Learning)

*머신러닝 유형(by 마스터 알고리즘 책)

기호주의: 결정트리

연결주의: 신경망/딥러닝유전 알고리즘

베이지안 통계

유추주의: KNN, 서포트 벡터 머신

*머신러닝의 단점

  • 데이터에 너무 의존적
  • 실제 환경 데이터 적용 시 과적합 되기 쉬움
  • 논리적인 이해가 어려울 수 있음
  • 데이터만 집어넣으면 최적화된 결과를 도출할 것이라는 것은 환상

3> 파이썬 기반 머신러닝의 특징 및 장점과 구성요소

* 장점 - 뛰어난 확장성, 연계, 호환성, 딥러닝으로의 진격

  • 쉽고 뛰어난 개발 생산성으로 활용도가 높음
  • 오픈소스 계열의 전폭적인 지원
  • 많은 라이브러리 지원
  • 인터프리터 언어 특성상 속도는 느리지만 쉽고 유연한 특징으로 인해 데스크탑, 서버, 네트워크, 시스템, IOT 등 다양한 영역에서 사용되고 있음.

*머신러닝 패키지 생태계를 구성하는 주요 패키지

머신러닝 패키지- 사이킷런

배열/선형대수/ 통계 패키지 - numpy(다차원), scipy

데이터 핸들링(2차원) - pandas

시각화 - matplotlib, seaborn

대화형 파이썬툴 - jupyter

반응형