-
연관규칙(Association rules) 파이썬 구현하기 mlxtend.frequent_patterns.aprioriData Science/데이터마이닝 2022. 10. 4. 17:06반응형
from mlxtend.frequent_patterns import apriori from mlxtend.frequent_patterns import fpmax from mlxtend.frequent_patterns import association_rules itemsets = apriori(fp_df, min_support=0.2, use_colnames=True) itemsets.sort_values("support", ascending=False) #fpmax(fp_df, min_support=0.2, use_colnames=True) rules = association_rules(itemsets, min_threshold=0.5)
antecedents : X
consequent : Y
antecedent support : 데이터에서 X의 출현빈도
consequent support : 데이터에서 Y의 출현빈도
support(지지도) : X+Y의 출현빈도
confidence(신뢰도) : 조건부 확률 s(X+Y)/s(X)
lift(향상도) : confidence / (antecedent support*consequent support) #약간의 정규화 의미 1미만>negatively, 1초과>positively correlation 1>independent
leverage : ??
conviction : ?? lift랑 비례한다?반응형'Data Science > 데이터마이닝' 카테고리의 다른 글
파이썬에서 시간값 다루기 - Datetime, Timedelta (0) 2022.10.07 클러스터링 기법 - 개념, 타당성평가, 종류 (0) 2022.10.05 데이터 형(data type) 종류 (0) 2022.09.29 [XAI/Python] SHAP 파이썬 라이브러리 사용 코드 예시(SHapley Additive exPlanations) (0) 2022.07.15 회귀분석 평가지표 종류(특징, 장단점, 파이썬 코드) (0) 2022.06.23