loc
-
[Pandas] 데이터프레임 필터링, 특정 조건에 맞는 행/열 추출하기 (DataFrame.loc[])Data Science/Pandas & Numpy&Scikit-learn 2022. 10. 2. 18:24
이번 글에서는 데이터프레임에서 원하는 조건들을 적용해서 원하는 행 또는 열을 추출하는 방법을 작성한다. Pandas에서 데이터프레임 필터링 방법은 여러가지가 있지만 해당글에서는 loc만을 다룬다. 1. 데이터 준비 seaborn 라이브러리에서 제공하는 taxis 데이터셋을 사용한다. (참고 : sns.load_dataset, 파이썬 데이터샘플 불러오기) import seaborn as sns df = sns.load_dataset('taxis') print(df) print(df.info()) 2. Pandas DataFrame.loc[] 사용법 가장 기본이 되는 문법은 DataFrame.loc[ 행조건 , 열조건 ] 이다. 행조건에는 index 또는 bool 타입의 리스트가 사용된다. 열조건에는 컬럼 ..
-
[Pandas] Pandas를 통한 데이터 전처리Data Science/Pandas & Numpy&Scikit-learn 2022. 9. 13. 23:15
1. Pandas 인스톨 및 import pip install pandas import pandas as pd # as pd의 의미는 앞으로 pandas를 pd라는 약자로 부르겠다 2. 데이터프레임 생성 2.1 파일로부터 데이터프레임 생성 df = pd.read_csv("파일위치/파일이름.csv") 인자이름 기본값 변경가능값 의미 sep ',' 구분자로 사용할 문자열 컬럼간 구분자 csv의 구분자인 ','가 기본값이다 header 'infer' None 파일에 항목이름(column)이 없을경우 None으로 설정 names 없음 항목이름 리스트 읽어오는 데이터의 항목이름 설정 usecols None 항목이름 리스트 지정된 항목만 읽어옴 df = pd.read_csv('myfile.txt', header=N..
-
[Python]다중 조건으로 데이터 프레임 특정 행 추출하기(데이터 프레임 필터링)Data Science/Pandas & Numpy&Scikit-learn 2022. 5. 10. 22:46
0. 서론 데이터 전처리, 분석 등에서 가장 많이 사용되는 기능 중 하나로는 데이터프레임에서 특정 행을 추출하는 필터링이 있다. 많은 수업 및 블로그들에서 loc 등을 통한 필터링을 알려주고 있지만 다중 조건에 대한 내용은 잘 나오지 않는다. 실제 분석 업무에서는 여러가지 조건을 중첩하여 사용하게 되는데, 이에대한 간단한 실험과 효율적 방법에 대해서 포스팅해본다. 1. 데이터 준비 실험 및 예시에서 사용될 데이터는 seaborn에서 제공하는 "taxis" 샘플을 사용한다. 14개의 컬럼으로 구성되어 있으며 여러 타입의 데이터가 존재한다. import seaborn as sns df = sns.load_dataset('taxis') df.info() seaborn에서 제공하는 데이터 셈플에 대한 자세한 내..