Python
-
[인코딩,sklearn] One-Hot EncodingData Science/Pandas & Numpy&Scikit-learn 2021. 9. 14. 10:07
인코딩 방법에는 여러가지가 존재한다. 본 포스팅에서는 가장 널리 쓰이는 One-Hot 인코딩을 사용한다. 샘플 데이터 생성 import pandas as pd df=pd.DataFrame({ 'ID':[1,2,3,4,5], 'name':['아메리카노','바닐라라떼','아메리카노','민트초코','아메리카노'], 'tumbler':['N','Y','Y','N','N'] }) print(df) 컬럼별 데이터 타입 살펴보기 print(df.dtypes) 범주형 데이터 타입만 살펴보기 (categorical, object) categorical_list = df.dtypes[df.dtypes == "object"].index.tolist() print("Categorical features: ", categori..
-
[문자열/Regex] 문자열 특정 문자 바꾸기Data Science/데이터마이닝 2021. 5. 17. 20:13
문자열에서 특정 문자 바꾸기를 알아봅니다. 오늘의 포스팅에서는 아래와 같은 문자열을 통해 진행해보겠습니다. sample = "My phone number is 010-0000-0000" 1. Replace #기본 문법 => replace(원본값,변경값,변경횟수) result1 = sample.replace('0','9') # 변경횟수는 기본값 all result2 = sample.replace('0','9',1) result3 = sample.replace('0','9',3) My phone number is 919-9999-9999 My phone number is 910-0000-0000 My phone number is 919-9000-0000 2. re.sub #기본 문법 => re.sub(원본값..
-
[파이썬/Python]컴프리헨션(Comprehension)프로그래밍/파이썬 기초 2021. 2. 22. 21:36
파이썬은 컴프리헨션이라는 문법을 통해 list, dictionary 등의 작성을 간단화 할 수 있다. 1. 리스트 생성 1 2 3 4 5 6 # 일반 방법 nums = [] for i in range(10): nums.append(i) # 컴프리헨션을 통한 방법 nums = [i for i in range(10)] cs 2. 조건문 추가( if ) 1 2 3 4 5 6 7 8 # 일반 방법 nums = [] for i in range(1,11): if n % 2 == 0: nums.append(i) # 컴프리헨션 방법 nums = [i for i in range(1,11) if i % 2 == 0] cs 3. 조건문 추가( if & else ) 1 2 3 4 5 6 7 8 9 10 # 일반 방법 nums..