Data Science/ML&DL 모델
-
DBSCAN(Density-based spatial clustering of applications with noise, 밀도기반 군집화) 파이썬구현하기Data Science/ML&DL 모델 2022. 10. 5. 15:56
해당 글에서는 density based clustering(밀도기반 클러스터링,군집화)을 파이썬으로 구현해본다. 사용되는 라이브러리는 아래와 같다. 모델 : sklearn.cluster.DBSCAN 평가 : sklearn.metrics.silhouette_score , silhouette_samples, yellowbrick.cluster.KElbowVisualizer Clustering에 대한 이론적인 부분은 "클러스터링 기법(개념,타당성,평가)" 글을 참고. 1. 데이터 준비 sklearn에서 제공해주는 iris 데이터를 사용한다. clustering이기에 종속변수를 제외하고 독립변수만으로 데이터프레임을 구성한다. import pandas as pd from sklearn import datasets..
-
K-means Clustering 파이썬 구현하기Data Science/ML&DL 모델 2022. 10. 5. 15:38
해당 글에서는 clustering(클러스터링,군집화)의 대표적 기법인 K-Means를 파이썬으로 구현해본다. Clustering에 대한 이론적인 부분은 "클러스터링 기법(개념,타당성,평가)" 글을 참고. 1. 데이터 준비 sklearn에서 제공해주는 iris 데이터를 사용한다. clustering이기에 종속변수를 제외하고 독립변수만으로 데이터프레임을 구성한다. import pandas as pd from sklearn import datasets iris = datasets.load_iris() X = iris.data y = iris.target df = pd.DataFrame(X, columns = iris.feature_names) print(df) clustering에서는 각 독립변수(컬럼)별로 ..