파이썬
-
[Python]다익스트라 알고리즘 구현(Dijkstra algorithm)프로그래밍/알고리즘 2022. 9. 20. 16:47
이번 글에서는 파이썬 언어를 사용하여 다익스트라 알고리즘을 구현합니다. 1. 다익스트라 알고리즘이란? 노드(node)간에 방향과 가중치를 가지는 간선(edge)으로 연결된 그래프에서, A지점에서 B지점으로 가는 최단거리를 구할 수 있는 알고리즘. 단, 간선의 가중치가 양수일 경우에만 사용 가능하다. 2. 구현 코드 우선순위 큐 준비 import heapq 그래프 인접 리스트 준비 node_n = 6 # (출발노드,도착노드,이동값) arr = [(0,1,7),(1,2,3),(2,0,1),(0,3,4),(2,3,5),(3,2,1),(3,4,8),(4,3,1),(2,4,2),(1,4,4),(4,5,2),(3,5,9)] adj_lst = [[] for x in range(6)] for sp, ep, cost i..
-
[파이썬/자료형]딕셔너리(Dictionary)기타 2022. 9. 7. 11:43
1. 딕셔너리란 키(key)와 값(value)로 이루어진 자료형 키에 해당하는 값을 넣어 만들 수 있다 2. 선언 2.1 빈 딕셔너리 선언 dic = {} 2.2 key와 value를 넣어서 선언 dic = { 'a':0, 'b':1, 'c':2 } 2.3 다양한 타입의 value를 넣어서 선언하기 dic = { 'int_v' : 1, 'str_v' : 'hello', 'lst_v' : [], 'lst_v2' : [1,2,3], 'tup_v' : (1,2,3) } 3. Key/value 호출 key/value 호출 예시를 위해서 2.3항목의 딕셔너리를 사용한다고 가정함 3.1 전체 key 목록 불러오기 기본적인 반환타임은 dict_keys 형태이다 리스트형을 원하면 list()를 통해 형변환을 해야한다 ..
-
mathplotlib.pipy 자주쓰는 파라미터 세팅Data Science/시각화 2022. 7. 27. 21:11
파이썬에서 mathplotlib.pipy 라이브러리를 사용하며 자주 사용하게 되는 파라미터들을 정리한다. 흔히 우리가 약어인 plt로 사용하기도 한다. 1. Base code import numpy as np import pandas as pd import random import matplotlib.pyplot as plt import seaborn as sns df = pd.DataFrame({ 'col1' : [random.randrange(-10,10) for i in range(100)], 'col2' : [random.randrange(-10,10) for i in range(100)] }) sns.scatterplot(data = df, x = 'col1', y = 'col2') 2. mat..
-
[Python]다중 조건으로 데이터 프레임 특정 행 추출하기(데이터 프레임 필터링)Data Science/Pandas & Numpy&Scikit-learn 2022. 5. 10. 22:46
0. 서론 데이터 전처리, 분석 등에서 가장 많이 사용되는 기능 중 하나로는 데이터프레임에서 특정 행을 추출하는 필터링이 있다. 많은 수업 및 블로그들에서 loc 등을 통한 필터링을 알려주고 있지만 다중 조건에 대한 내용은 잘 나오지 않는다. 실제 분석 업무에서는 여러가지 조건을 중첩하여 사용하게 되는데, 이에대한 간단한 실험과 효율적 방법에 대해서 포스팅해본다. 1. 데이터 준비 실험 및 예시에서 사용될 데이터는 seaborn에서 제공하는 "taxis" 샘플을 사용한다. 14개의 컬럼으로 구성되어 있으며 여러 타입의 데이터가 존재한다. import seaborn as sns df = sns.load_dataset('taxis') df.info() seaborn에서 제공하는 데이터 셈플에 대한 자세한 내..
-
Visual Studio Code 설치방법 및 기본 사용법(VScode)환경&시스템 구축 2022. 1. 24. 21:53
Visual Studio Code(이하 VScode)의 설치 방법 1. 설치 파일 다운로드 아래의 주소에서 자신의 환경에 맞는 설치 파일을 받는다. https://code.visualstudio.com/Download# 2. 인스톨 진행 3. VScode 실행 VScode 실행시 다음과 같은 화면을 볼 수 있다. 4. 파일 생성 or 파일 불러오기 상단 툴바에서 File > New File 메뉴를 통해서 새로운 파일을 생성 할 수 있다. (단축키 : ctrl+n) 생성된 파일에서는 언어 타입을 선택하라고 나오는데, Select a Language를 클릭하면 아래와 같이 언어를 고를 수 있다. 현재 포스팅 중인 컴퓨터에는 파이썬이 설치되어 있지 않는데, 친절하게 python을 설치할 것인지 메시지도 송출된..
-
파이썬 시각화 그래프 여러개 그리기 plt.subplotsData Science/시각화 2021. 11. 5. 02:49
시각화 그래프를 나타 낼 때, 여러개의 그래프를 그리는 법. 1. 필요 라이브러리 import seaborn as sns import matplotlib.pyplot as plt 2. 데이터 준비 df = sns.load_dataset("iris") 데이터 샘플 불러오기에 대해서 자세히 알고싶다면 아래의 포스팅을 참고하세요. https://csshark.tistory.com/54 3. 그래프 여러개 그리기 오늘 사용할 그래프는 seaborn의 distplot입니다. seaborn의 distplot는 다음 포스팅에서 자세히 확인 가능합니다.(https://csshark.tistory.com/53) sns.distplot(df['sepal_length']) 3.1 가로로 그래프 여러개 그리기 fig, ax ..
-
파이썬 데이터 샘플 불러오기 seaborn.load_dataset (titanic 외 18)Data Science/데이터셋 2021. 11. 3. 02:36
데이터 분석 또는 시각화를 연습하거나 예시를 들때 그 재료가될 데이터가 필요하다. seaborn 라이브러리에서는 이럴 때 사용할 수 있는 데이터를 간편하게 제공하고 있다. 기본적으로 19개의 csv파일이 제공되며 그외에 이미지 등도 제공된다. 본 포스팅에서는 기본적으로 제공되는 19개의 csv 파일을 다룬다. 1. seaborn.load_dataset 데이터를 호출하는 함수 이름은 load_dataset이다. 인자로는 단순히 데이터의 이름을 입력한다. import seaborn as sns sns.load_dataset('데이터셋 이름') 2. 데이터 호출하기 2.1 아이리스 꽃 데이터(Iris) import seaborn as sns df = sns.load_dataset('iris') 2.2 타이타닉..
-
파이썬 시각화 히스토그램 그리기 Seaborn.distplotData Science/시각화 2021. 11. 2. 20:05
Seaborn 라이브러리를 이용하여 히스토그램(histogram)을 그려보겠습니다. 1. 데이터 준비 seaborn에서 기본적으로 제공해주는 tips 데이터셋을 불러와서 예시로 사용합니다. tips 데이터셋은 아래 그림과 같이 dataframe 형태로 구성되어 있는 것을 확인 할 수 있습니다. import seaborn as sns df = sns.load_dataset("tips") print(df) 2. 히스토그램 그리기 seaborn.distplot에서는 데이터프레임(df)의 특정 컬럼을 지정해주면 해당하는 히스토그램을 나타냅니다. import seaborn as sns df = sns.load_dataset("tips") ax = sns.distplot(df['total_bill']) 위의 그래프..