컴퓨터하는 상어
-
R-CNN(Regions with Convolutional Neuron Networks features) 모델 개념 설명Data Science/ML&DL 모델 2022. 11. 12. 17:03
1. R-CNN이란? 1) 이미지 입력 2) regional proposal 출력 3) 이미지 전처리(동일 사이즈) 4) 예측 2. Region Proposal R-CNN에서는 CNN에 넣을 Region을 찾기위해서 selective search 방법을 사용했다. selective search는 sliding window의 단점을 극복한 방법이다. 2.1 Sliding Window 이미지에 window를 슬라이딩하며 물체가 존재하는지 확인하는 방법. window로 이미지의 모든 부분을 탐색해야하여 많은 시간을 소모하는 단점. 탐지하고자하는 객체들의 크기가 다양하다면 고정된 window가 정확히 맞지 않는다는 단점. (다양한 window의 윈도우를 사용해야함.) R-CNN에서는 해당 방법을 사용하지 않음...
-
최적화 함수 종류 및 개념(Optimization Function)Data Science/데이터마이닝 2022. 11. 11. 23:48
1. Gradient Descent(GD, 경사하강법) 함수의 기울기를 구하고 기울기의 반대 방향으로 이동시켜 최소값에 이르를때까지 반복하는 기법. ML모델의 최적화시에 전체 데이터를 모두 사용하기에 Batch Gradient Descent라고 부르기도 한다. 모든 데이터에 대한 loss를 구해야하기 때문에 많은 연산량을 요구한다. $$ w_{i+1} = w_{i}-\gamma _{i}\triangledown f(w_{i}) $$ \( \gamma \) : 이동 거리를 조절하는 매개변수, 흔히 Learning rate(학습률)로써 ML분야에서 쓰인다. \( \triangledown \) : 미분연산자를 의미한다. (nabla, 나블라) 2. Gradient Descent 종류에서 주의해야할 점 2.1 적..
-
Pytorch Resnet 예시코드(CNN, Resnet18, Cats and Dogs Dataset, Augmentation)Data Science/Pytorch 2022. 11. 10. 00:44
1. Data Set 준비하기 1.1 Data .zip 파일 다운받기 !wget --no-check-certificate \ https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \ -O ./cats_and_dogs_filtered.zip 1.2 .zip 파일 압축 풀기 ! unzip -q cats_and_dogs_filtered.zip -d ./ 1.3 파일 구조 "cats and dogs filtered" 폴더 내부에서 "train", "validation" 폴더로 나누어진다. 각각 "cats", "dogs" 폴더를 가지며, 그 내부에는 해당하는 이미지들이 들어있다. 2. Data Preprocessing 2.1 이미지 경로..
-
머신러닝 수업 참고자료 리스트기타 2022. 11. 8. 15:26
----------이론---------- OLS, Ridge, LASSO, Quantile, Logistic Regression들의 특징 및 차이점이 뭘까요? Uncertainty Quantification(불확실성의 정량화) Kernel Method(Feature Mapping, Kernel, Kernel Trick) 머신러닝에서의 이상 탐지 종류(Anormaly Detection) Explainable AI & Interpretable ML 최적화 함수 종류 및 개념(Optimization Function) 머신러닝/딥러닝 하이퍼파라미터 최적화(ML/DL Hyperparameter Optimization) -작성중- ----------실습----------- Pytorch Lightning 사용가이드..
-
Kernel Method(Feature Mapping, Kernel, Kernel Trick)Data Science/데이터마이닝 2022. 11. 7. 22:06
1. Mapping Functoin을 통한 새로운 Feature Map 생성 기존에 주어진 \(Feature \ Space \ X\)가 문제를 Linear 한 방법으로 해결이 불가능할 경우, 새로운 \(Feature \ Space \ \phi(X)\)를 만들어 해결할 수 있으며, 이때 사용되는 \(\phi(X)\)를 Mapping Function이라고 한다. 이에 대한 예시는 아래와 같다. 그러나 어려움이 있으니. 1. 적절한 Mapping Function을 찾기 어려움 2. 기존 \( x_{i}^{T}x_{j}\) 비해서 \( \Phi(x_{i})^{T}\Phi(x_{j}) \)는 많은 연산량이 요구 (데이터의 컬럼 수가 증가하기 때문에 내적 연산량의 증가) 2. Mapping Function을 통한 ..
-
Jupyter Lab 괄호 자동 닫기 설정환경&시스템 구축/개발환경 2022. 11. 4. 16:05
Jupyter Lab의 초기세팅값에서 괄호의 자동 닫기가 설정되어 있지 않다. 따라서 자동완성을 사용하기위해서는 설정을 해주어야한다. 1. Tool bar에서 적용하기 Tool bar 에서 Auto Close Brackets를 체크해주면 괄호 자동닫기를 사용할수 있다. 혹시 해당 노트북파일에만 적용되고 새로생성한 노트북에는 적용되지 않는다면 2번 방법을 사용하기 바란다. 2. 환경설정해주기 Tool Bar에서 Settings > Advanced Settings Editor 로 들어간다. 우측 상단에 JSON Settings Editor를 클릭한다 Notebook의 User Preferences에 "codeCellConfig":{"autoClosingBrackets":true} 구문을 추가해주면 된다. N..
-
최대우도법(Maximum Likelihood Estimation, MLE)Data Science/데이터마이닝 2022. 11. 3. 23:42
어떠한 예측 모델을 만들때 생성된 모델이 얼마나 Train data set을 잘 설명하는지를 측정할 필요가 있으며, 이를 좋은 방향으로 개선해나아감으로 모델을 학습할 수 있다. Train data set에 대한 설명력을 측정하는 가장 대표적인 방법으로는 손실함수(Loss function)가 있다. 다른 방법으로는 이번 포스팅에서 설명할 Likelihood가 있다. 1. Likelihood란? X라는 데이터는 자연에서의 True Distribution에서 발생하였다. 이때, 우리는 모집단을 알수 없기 때문에 샘플링 된 데이터를 통해서 True Distribution을 추정해야한다. 따라서 True Distribution일 가능성(Probability)을 Likelihood라고 할 때 가장 높은 가능성을 가..
-
Tensorflow Max Pooling 개념 및 예시 코드(tensorflow.keras.layers.MaxPool2D)Data Science/Tensorflow 2022. 11. 1. 23:42
1. Max Pooling이란 데이터에 필터를 씌워서 필터 내부에 가장 큰 값으로 기존의 값을 대체하는 기법 아래 그림에서는 숫자 7을 중심으로 3*3 필터를 사용하여서 가장 큰 값 9로 대체한다. 2. Tensorflow에서 maxpooling 사용 및 수행과정 확인 Tensorflow에서는 tensorflow.keras.layers.MaxPool2D 라이브러를 활용하여 maxpooling을 구현할수 있다. 이때, stride와 padding에 따라서 maxpooling이 어떻게 동작하는지 case별로 확인해본다. 2.1 실험준비 및 임의의 데이터 생성 import tensorflow as tf from tensorflow.keras.layers import MaxPool2D input_image = ..