Data Science/ML&DL 모델
-
Faster R-CNN(Faster Regions with Convolutional Neuron Networks features) 모델 개념 설명Data Science/ML&DL 모델 2022. 11. 16. 22:38
본 포스팅은 R-CNN 및 Fast R-CNN을 알고있다는 가정하에 작성되었습니다. 따라서 위의 내용과 중복되는 내용은 생략되었습니다. R-CNN(Regions with Convolutional Neuron Networks features) 모델 개념 설명 Fast R-CNN(Fast Regions with Convolutional Neuron Networks features) 모델 개념 설명 1. Faster R-CNN이란? 기존의 Fast R-CNN에서의 단점을 극복한 2-path object detection model이다. Selective search를 통해서 RoI를 추출하는 과정이 많은 시간을 소요하여 병목현상 일으켰다.(cpu 수행) => Gpu를 활용할 수 있는 Region Proposa..
-
Fast R-CNN(Fast Regions with Convolutional Neuron Networks features) 모델 개념 설명Data Science/ML&DL 모델 2022. 11. 15. 00:09
해당 포스팅은 R-CNN을 알고있다는 가정하에 작성되었습니다. R-CNN(Regions with Convolutional Neuron Networks features) 모델 개념 설명 1. Fast R-CNN이란? Fast R-CNN은 R-CNN이 기존에 가지고 있던 단점을 보완함을써 더욱 빠른 처리속도를 가지는 모델이다. 2000개의 RoI가 각자 CNN을 통과하여 Feature Vector를 생산하여 많은 연산량이 요구되었다. => 원본이미지만 CNN에 통과시켜 Feature Map을 생성한다. => RoI와 Feature Map을 RoI Pooling Layer에 넣어 Feature Vector를 생성한다. Multi Stage Model로써 End-to-End 학습이 불가능하다. => Featur..
-
R-CNN(Regions with Convolutional Neuron Networks features) 모델 개념 설명Data Science/ML&DL 모델 2022. 11. 12. 17:03
1. R-CNN이란? 1) 이미지 입력 2) regional proposal 출력 3) 이미지 전처리(동일 사이즈) 4) 예측 2. Region Proposal R-CNN에서는 CNN에 넣을 Region을 찾기위해서 selective search 방법을 사용했다. selective search는 sliding window의 단점을 극복한 방법이다. 2.1 Sliding Window 이미지에 window를 슬라이딩하며 물체가 존재하는지 확인하는 방법. window로 이미지의 모든 부분을 탐색해야하여 많은 시간을 소모하는 단점. 탐지하고자하는 객체들의 크기가 다양하다면 고정된 window가 정확히 맞지 않는다는 단점. (다양한 window의 윈도우를 사용해야함.) R-CNN에서는 해당 방법을 사용하지 않음...
-
강화학습Data Science/ML&DL 모델 2022. 10. 31. 17:12
2. Sequential Process 어떠한 랜덤베리에이블들의 시퀀스 2.1 Markov chain 2.1.1 Markov property : 현재의 사건은 먼 과거와는 별로 상관이 없고 최근에 일어난 일과 상관이 있다. (q2를 알고싶을 때 q0은 이미 q1에 담겨있기 때문에 q1을 알면 q2를 알수 있다.) (실제로 q0과 q2는 연관이 있지만, q1이라는 노드가 고정되면 q0와 q2는 상관이 없다.) 현재 상태가 모든 정보를 담고 있다면 과거 정보는 필요없다. 2.1.2 Transition Matrix 2.2 Markov Reward Process ( MarkovChain + reward ) markov 가정에 의해 Memoryless한 Random process이다. passive stochas..
-
AutoEncoder 개념 및 종류Data Science/ML&DL 모델 2022. 10. 31. 00:12
1. AutoEncoder(오토인코더) 개념 AutoEncoder는 입력된 데이터를 압축시킨 후 다시 원본과 유사하게 복구하는 모델이다. 크게 Encoder, Decoder, Latent Representation으로 이루어져있다. Encoder는 입력된 데이터를 Latent Representation으로 압축시킨다. 이때 Latent Representation의 dimension(차원)은 입력데이터보다 작다. Decoder는 Latent Representation으로 압축된 데이터를 다시 원본 데이터 사이즈로 복구한다. 이때 우리의 목적은 Dimensionality Reduction이다. 아래 그림을 통해서 더 자세히 설명한다. 28*28 이미지를 Flatten하여 784 길이의 벡터로 만들어 입력값으..
-
Transformer Model 개념 및 모델 구조Data Science/ML&DL 모델 2022. 10. 28. 00:20
1. 개요 1.1 기존 Sequence to Sequence Model의 한계 context vector에 입력 문장의 정보를 압축하여 병목현상 발생 및 성능하락이 야기됨. (하나의 context vector가 입력 문장의 모든 정보를 가지고 있어야함.) (Context Vector는 고정된 길이의 벡터) Decoder에서 매번 히든스테이트를 갱신해야함. sos : start of sentence eos : end of sentence 1.2 Attenstion 개념이 추가된 Sequence to Sequence Model RNN에서 매 입력에따라 나오는 히든스테이트 전체를 예측의 입력으로 넣어주기위한 Attention Vector 등장. (아직 Transformer가 아닙니다.) Attention Ve..
-
서포트 벡터 머신(SVM,Support Vector Machine) 파이썬 구현하기(cvxpy, sklearnData Science/ML&DL 모델 2022. 10. 14. 02:00
1. 개념 SVM은 단순히 A or B 와 같이 class만을 비교하는 Perceptron 모델을 개량한 모델로, 분류선과 데이터간의 거리값(margin)을 최대화하여 분류 강건성을 높였다. 아래 그림에서는 분류선이 초록색 실선으로 나타나며, 양/음의 최대거리값(Maximized margin)의 경계선이 초록색 점선으로 나타난다. 경계선 내부에 찍혀있는 점은 이상치로써, 이를 모두 정상값으로 다루었을 때 강건한 분류선 및 margin이 계산되지 않기 때문에 이상치에 대한 처리도 고려되었다. 2. cvxpy를 통한 구현 2.1 필요 라이브러리 호출 import cvxpy as cvx import numpy as np import matplotlib.pyplot as plt 2.2 사용할 2차원 데이터 랜덤..
-
Hierarchy Clustering(계층적 군집화) 및 Dendrogram Visualization(덴드로그램 시각화) - AgglomerativeClustering, linkage, dendrogramData Science/ML&DL 모델 2022. 10. 5. 20:40
해당 글에서는 hierarchy clustering(계층적 클러스터링,군집화)을 파이썬으로 구현해본다. 사용되는 라이브러리는 아래와 같다. 모델 : scipy.cluster.AgglomerativeClustering 거리계산 : scipy.cluster.hierarchy.linkage 시각화 : scipy.cluster.hierarchy.dendrogram 평가 : sklearn.metrics.silhouette_score , silhouette_samples, yellowbrick.cluster.KElbowVisualizer Clustering에 대한 이론적인 부분은 "클러스터링 기법(개념,타당성,평가)" 글을 참고. 1. 데이터 준비 sklearn에서 제공해주는 iris 데이터를 사용한다. clust..