Data Science/데이터셋
-
보스턴 주택 가격 데이터셋 (Boston house prices)Data Science/데이터셋 2022. 7. 17. 22:14
0. 데이터 설명 미국 보스턴 지역의 타운 별 주택 가격 영향 요소를 정리한 데이터. 컬럼 설명 CRIM 타운 별 1인당 범죄율 ZN 25,000 피트 이상 주거용 토지 비율 INDUS 비소매 상업지역 점유 토지 비율 CHAS 강 인접 유무(1 = 강과 인접, 0 = 강과 인접하지 않음) NOX 산화질소 농도 RM 가구당 평균 방 수 AGE 1940년 이전 건축 주택 비율 DIS 5개 보스턴 직업센터 접근성 지수 RAD 방사형 도로 접근성 지수 TAX $10,000 당 재산세율 PTRATIO 도시별 학생/교사 비율 B 1000(Bk-0.63)^2 (Bk : 도시별 흑인 비율) LSTAT 모집단의 하위계층 비율(%) PRICES(Target) 본인 소유 주택가격(중앙값, 단위 : $1,000) 1. 파이썬..
-
파이썬 데이터 샘플 불러오기 seaborn.load_dataset (titanic 외 18)Data Science/데이터셋 2021. 11. 3. 02:36
데이터 분석 또는 시각화를 연습하거나 예시를 들때 그 재료가될 데이터가 필요하다. seaborn 라이브러리에서는 이럴 때 사용할 수 있는 데이터를 간편하게 제공하고 있다. 기본적으로 19개의 csv파일이 제공되며 그외에 이미지 등도 제공된다. 본 포스팅에서는 기본적으로 제공되는 19개의 csv 파일을 다룬다. 1. seaborn.load_dataset 데이터를 호출하는 함수 이름은 load_dataset이다. 인자로는 단순히 데이터의 이름을 입력한다. import seaborn as sns sns.load_dataset('데이터셋 이름') 2. 데이터 호출하기 2.1 아이리스 꽃 데이터(Iris) import seaborn as sns df = sns.load_dataset('iris') 2.2 타이타닉..
-
[파이썬] 주가(finance) 데이터 불러오기 - FinanceDataReaderData Science/데이터셋 2021. 9. 2. 16:28
주가 데이터 불러오기 필요 라이브러리 설치 pip install finance-datareader pip install BeautifulSoup4 라이브러리 선언 import pandas as pd import FinanceDataReader as fdr 데이터 불러오기 key_lst = ['USD/KRW','KS11','KQ11','KS200'] name_lst = ['환율','코스피','코스닥','코스피200'] df_lst = [] for x,name in zip(key_lst,name_lst): df_lst.append(fdr.DataReader(x, s_time, e_time)[['Close']]) korea_df = pd.concat(df_lst, axis=1) korea_df.columns ..