파이썬
-
파이썬 시각화 꺽은선그래프 그리기 Matplotlib.pyplot - plotData Science/시각화 2021. 10. 12. 14:50
Matplotlib의 pyplot은 다양한 시각화 기법(그래프)를 지원합니다. 그중에서 plot을 통해서 꺽은선그래프(line chart)를 그려보겠습니다. import matplotlib.pyplot as plt x_lst = [1,2,3,4,5] # x축좌표 y_lst = [1,4,9,16,25] # y축좌표 fmt = 'o-g' # [마커모양]+[선종류]+[색] plt.plot(x_lst, y_lst, fmt) plt.show() 1. x_lst, y_lst 그래프의 X축/Y축 좌표, 두 리스트의 길이는 동일해야합니다. 2. fmt(format) 꺽은선 그래프의 format을 나타내며 [마커모양], [선종류], [색]으로 구성되어있습니다. ㄴ세부 파라미터의 순서를 변경해도 되지만 mabplotlib..
-
[인코딩,sklearn] Ordinal EncodingData Science/Pandas & Numpy&Scikit-learn 2021. 9. 14. 10:19
인코딩 방법에는 여러가지가 존재한다. 본 포스팅에서는 Ordinal 인코딩을 사용한다. One-Hot 인코딩은 단어 집합의 크기를 벡터 차원으로 하여 0과 1로 표현하는 반면, Ordinal 인코딩은 단어를 0~n의 값으로 치환한다. 따라서 데이터프레임의 컬럼 개수는 그대로이다. 샘플 데이터 생성 import pandas as pd df=pd.DataFrame({ 'ID':[1,2,3,4,5], 'name':['아메리카노','바닐라라떼','아메리카노','민트초코','아메리카노'], 'tumbler':['N','Y','Y','N','N'] }) print(df) 컬럼별 데이터 타입 살펴보기 print(df.dtypes) 범주형 데이터 타입만 살펴보기 (categorical, object) categoric..
-
[인코딩,sklearn] One-Hot EncodingData Science/Pandas & Numpy&Scikit-learn 2021. 9. 14. 10:07
인코딩 방법에는 여러가지가 존재한다. 본 포스팅에서는 가장 널리 쓰이는 One-Hot 인코딩을 사용한다. 샘플 데이터 생성 import pandas as pd df=pd.DataFrame({ 'ID':[1,2,3,4,5], 'name':['아메리카노','바닐라라떼','아메리카노','민트초코','아메리카노'], 'tumbler':['N','Y','Y','N','N'] }) print(df) 컬럼별 데이터 타입 살펴보기 print(df.dtypes) 범주형 데이터 타입만 살펴보기 (categorical, object) categorical_list = df.dtypes[df.dtypes == "object"].index.tolist() print("Categorical features: ", categori..
-
[파이썬] 주가(finance) 데이터 불러오기 - FinanceDataReaderData Science/데이터셋 2021. 9. 2. 16:28
주가 데이터 불러오기 필요 라이브러리 설치 pip install finance-datareader pip install BeautifulSoup4 라이브러리 선언 import pandas as pd import FinanceDataReader as fdr 데이터 불러오기 key_lst = ['USD/KRW','KS11','KQ11','KS200'] name_lst = ['환율','코스피','코스닥','코스피200'] df_lst = [] for x,name in zip(key_lst,name_lst): df_lst.append(fdr.DataReader(x, s_time, e_time)[['Close']]) korea_df = pd.concat(df_lst, axis=1) korea_df.columns ..
-
[Bokeh] 꺽은선 그래프 그리기 (Line chart)Data Science/시각화 2021. 2. 26. 20:31
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 import numpy as np from bokeh.io import curdoc from bokeh.layouts import row from bokeh.models import ColumnDataSource from bokeh.plotting import figure # Set up data N = 200 x = np.linspace(0, 4*np.pi, N) y = np.sin(x) source = ColumnDataSource(data=dict(x=x, y=y)) # Set up plot plot = figure(plot_height=400, plot_width=400, title="my sine w..
-
[파이썬/Python]컴프리헨션(Comprehension)프로그래밍/파이썬 기초 2021. 2. 22. 21:36
파이썬은 컴프리헨션이라는 문법을 통해 list, dictionary 등의 작성을 간단화 할 수 있다. 1. 리스트 생성 1 2 3 4 5 6 # 일반 방법 nums = [] for i in range(10): nums.append(i) # 컴프리헨션을 통한 방법 nums = [i for i in range(10)] cs 2. 조건문 추가( if ) 1 2 3 4 5 6 7 8 # 일반 방법 nums = [] for i in range(1,11): if n % 2 == 0: nums.append(i) # 컴프리헨션 방법 nums = [i for i in range(1,11) if i % 2 == 0] cs 3. 조건문 추가( if & else ) 1 2 3 4 5 6 7 8 9 10 # 일반 방법 nums..