Data Science/데이터셋
보스턴 주택 가격 데이터셋 (Boston house prices)
상어군
2022. 7. 17. 22:14
반응형
0. 데이터 설명
미국 보스턴 지역의 타운 별 주택 가격 영향 요소를 정리한 데이터.
컬럼 | 설명 |
CRIM | 타운 별 1인당 범죄율 |
ZN | 25,000 피트 이상 주거용 토지 비율 |
INDUS | 비소매 상업지역 점유 토지 비율 |
CHAS | 강 인접 유무(1 = 강과 인접, 0 = 강과 인접하지 않음) |
NOX | 산화질소 농도 |
RM | 가구당 평균 방 수 |
AGE | 1940년 이전 건축 주택 비율 |
DIS | 5개 보스턴 직업센터 접근성 지수 |
RAD | 방사형 도로 접근성 지수 |
TAX | $10,000 당 재산세율 |
PTRATIO | 도시별 학생/교사 비율 |
B | 1000(Bk-0.63)^2 (Bk : 도시별 흑인 비율) |
LSTAT | 모집단의 하위계층 비율(%) |
PRICES(Target) | 본인 소유 주택가격(중앙값, 단위 : $1,000) |
1. 파이썬에서 로드하기
import pandas as pd
import numpy as np
from sklearn import datasets
boston = datasets.load_boston()
df = pd.DataFrame(boston.data, columns = boston.feature_names)
df['PRICES'] = boston.target
df.head()
반응형