본문 바로가기

AI 공부하기3

CS231n 4. Introduction to Neural Networks (요약,정리!) Backpropagation (gradient for neural network) 네트워크 전체에 대해 Chain rule(연쇄 법칙)을 적용하여 gradient를 계산하는 방법 중 하나로 이를 이용해 loss function의 gradient를 구해 parameter들을 최적화(optimization)하는데 사용한다. 또한 neural networks을 효과적으로 개발, 디자인 및 디버그하는데 중요하다 우리가 Backpropagation를 공부하는 이유? 실제로 #analytic_gradient 를 어떻게 계산하는지에 대해 알아볼거임! 여러개의 linear classification을 사용할 경우 gradient를 어떻게 찾을 것인지!=> 이 gradient를 이용해 loss를 구함 - 입력값 xi(이.. 2024. 3. 14.
CS231 2. Image Classification(score function) Image Classification Problem: 입력 이미지(input image)를 미리 정해진 카테고리 중 하나인 라벨(label)로 분류하는 문제로써 Computer Vision에서 매우 핵심적인 문제로 알려져있다. 현재 이미지를 구별하는데 여러 현실적인 문제가 존재한다. - semantic gap: 우리 눈: 고양이가 한 눈에 들어온다! VS 컴퓨터: 매우 크고 다양한 숫자들로 이루어진 배열로 인식! - 컴퓨터가 이것이 무엇인지 정확히 이해하고 있는 것이 아니고 무엇을 뜻하는지 알아내는 것이 쉽지 않음 - 조금만 카메라를 돌리면 사진을 이루는 픽셀의 숫자가 바로 바뀌게 됨 -> 다시 학습을 해야함 문제점 1. Viewpoint variation(시점 변화) 2. Scale variation(.. 2024. 1. 23.
머신러닝을 위한 수학 (개요) 머신러닝에서의 수학이란? 데이터(data) 속의 표현(특징)을 기계가 학습한 것으로 데이터의 대부분은 고차원으로 되어있다. 이것은 곧 백터와 행렬로 구성되어 있다는 것을 뜻한다. 이때 ML 알고리즘은 고차원 데이터의 표현(특징)을 학습 목적에 맞게 뽑아내는 함수(function)를 학습한다. (알고리즘은 사실상 수학으로 만든 함수) Python에서 데이터 처리 Python을 이용하는 이유: 1. 매우 직관적 2. 별도의 컴파일이 필요 없음 3. 오픈소스 라이브러리가 파이썬으로 공유됨 Numpy: 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리(다차원 배열을 쉽게 처리)=> import numpy as np Pandas: Data Science에서 데이터 분석을.. 2023. 10. 14.