ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Naive bayes
    카테고리 없음 2022. 9. 30. 11:29
    반응형

    카테고리컬 데이터만 입력받아야한다.

    입력된 데이터와 같은 값들을 가지는 그룹에서 가장 많이 등장하는 답을 제출

     

    exact bayes로 계산할 수 있으나

    차원이 높아질 수록 해당 조건에 대한 데이터가 없을 확률이 높고 편향된 데이터가 발생 할 수 있음

    따라서, naive bayes로 계산하여  이를 해결

     

    from sklearn.datasets import load_iris
    from sklearn.model_selection import train_test_split
    from sklearn.naive_bayes import GaussianNB
    X, y = load_iris(return_X_y=True)
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=0)
    gnb = GaussianNB()
    y_pred = gnb.fit(X_train, y_train).predict(X_test)
    print("Number of mislabeled points out of a total %d points : %d"% (X_test.shape[0], (y_test != y_pred).sum()))

     

    반응형

    댓글

Designed by Tistory.