머신러닝에서의 수학이란?
데이터(data) 속의 표현(특징)을 기계가 학습한 것으로 데이터의 대부분은 고차원으로 되어있다. 이것은 곧 백터와 행렬로 구성되어 있다는 것을 뜻한다. 이때 ML 알고리즘은 고차원 데이터의 표현(특징)을 학습 목적에 맞게 뽑아내는 함수(function)를 학습한다. (알고리즘은 사실상 수학으로 만든 함수)
Python에서 데이터 처리
Python을 이용하는 이유: 1. 매우 직관적 2. 별도의 컴파일이 필요 없음 3. 오픈소스 라이브러리가 파이썬으로 공유됨
Numpy: 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리(다차원 배열을 쉽게 처리)=> import numpy as np
Pandas: Data Science에서 데이터 분석을 위해 사용되는 라이브러리 => 행렬과 같은 테이블 형식(csv)를 읽는데 사용
Maplotlib: 함수를 그래프로 시각화하는 도구 (데이터 분석 결과를 시각화하는 것에 활용) => import matplotlib.pyplot as plt