-
Naive bayes카테고리 없음 2022. 9. 30. 11:29반응형
카테고리컬 데이터만 입력받아야한다.
입력된 데이터와 같은 값들을 가지는 그룹에서 가장 많이 등장하는 답을 제출
exact bayes로 계산할 수 있으나
차원이 높아질 수록 해당 조건에 대한 데이터가 없을 확률이 높고 편향된 데이터가 발생 할 수 있음
따라서, naive bayes로 계산하여 이를 해결
from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB X, y = load_iris(return_X_y=True) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=0) gnb = GaussianNB() y_pred = gnb.fit(X_train, y_train).predict(X_test) print("Number of mislabeled points out of a total %d points : %d"% (X_test.shape[0], (y_test != y_pred).sum()))
반응형