컴퓨터하는 상어
-
회귀분석 평가지표 종류(특징, 장단점, 파이썬 코드)Data Science/데이터마이닝 2022. 6. 23. 22:07
대학원생일때까지만 해도 평가지표는 단순히 모델의 성능을 나타내는 것이라고 생각했었는데. 회사에서 평가지표란 프로젝트의 성공 및 적용 여부를 표현할 수 있어야 하며, 관리자(팀장,임원 등)들을 설득시킬 수 있어야 했다. 본 글에서는 회귀분석에서는 평가지표들을 간단히 짚어보며 수식, 특징, 파이썬 코드와 더불어서 간단한 사족을 붙이려 한다. 각 평가지표의 수식의 경우 다양한 블로그 및 사이트에서 다루므로 생략한다. 0. 목록 R Squared(R2, 결정계수) Adjusted R Squared(Adjusted R2, 조정된 결정계수) MAE(Mean Absolute Error, 평균절대오차) MSE(Mean Squared Error, 평균제곱오차) RMSE(Root Mean Squared Error, 평균제..
-
Ubuntu 20.04 LTS iso 파일 다운로드(우분투 20.04 LST)환경&시스템 구축/VMware 2022. 6. 23. 17:38
흔히 가상머신에 Ubuntu를 설치하기 위해서 사용되는 Ubuntu 20.04 LTS iso 파일을 받는 링크는 아래와 같습니다. (클릭하면 다운로드가 진행됩니다.) https://releases.ubuntu.com/20.04/ubuntu-20.04.4-desktop-amd64.iso 직접 홈페이지에서 받고 싶다면 아래의 링크로 들어가면 됩니다. https://releases.ubuntu.com/20.04/
-
회귀모델에서 타겟(y)값의 정규화 방법 비교 실험Data Science/Pandas & Numpy&Scikit-learn 2022. 5. 27. 23:26
선형회귀에서는 타겟(y)값이 정규분포라는 가정을 한다. 문득, 실제로 모델에서 어떠한 성능적 영향을 미치는지 궁금증이 나타났다. 또한 트리기반의 모델에서는 타겟값의 정규분포가 영향을 미치는지 같이 실험을 진행한다. ※ 본 실험은 수학적 분석 기반이 아닌, 라이브러리를 활용한 단순 실험임을 밝힙니다. 여러 지적사항 및 의견이 있으신분은 편하게 댓글로 말씀해주시기 바랍니다. 0. 적용 정규화 방법 1. Raw data 2. MinMaxScaler 3. StandardScaler 4. RobustScaler 5. Log Transfer 6. Log Transfer + StandardScaler 7. Boxcox Transfer 8. Boxcox Transfer + StandardScaler 1. 사용 데이터 ..
-
글또 7기를 시작하며일상 잡담 2022. 5. 13. 20:55
글또 7기를 시작하는 다짐글을 쓰게되었습니다. 글 쓰는 또라이가 세상을 바꾼다 라는 모임입니다. (글또 소개글 바로가기) 0. 지원 동기 내가 공부한 내용들을 글로 남기면서 블로그를 키워나가겠다는 넓은 포부와는 다르게, 블로그에 작성되는 글은 개수도 적으며 그 내용도 각오에 한참 못미치고 있었습니다. 퇴근하고 집에 도착한 저에게 공부를 하고 그 내용을 기록한다는건 정말 어려운 일이었습니다. 친구, 술, 게임, 침대, 그리고 유튜브까지 수많은 유혹들이 저를 잡아 흔들었습니다. 그러던 어느날, 친한 동생이 카톡을 보내오더군요. 글또라는 좋은 모임이 있고 저도 해볼 생각이 없냐는 내용이었습니다. 무언가 내가 글을 써야하는 트리거가 되어줄 것 같다는 생각에 냉큼 7기에 신청을 했습니다. 1. 글또 시작과 작은 ..
-
[Python]다중 조건으로 데이터 프레임 특정 행 추출하기(데이터 프레임 필터링)Data Science/Pandas & Numpy&Scikit-learn 2022. 5. 10. 22:46
0. 서론 데이터 전처리, 분석 등에서 가장 많이 사용되는 기능 중 하나로는 데이터프레임에서 특정 행을 추출하는 필터링이 있다. 많은 수업 및 블로그들에서 loc 등을 통한 필터링을 알려주고 있지만 다중 조건에 대한 내용은 잘 나오지 않는다. 실제 분석 업무에서는 여러가지 조건을 중첩하여 사용하게 되는데, 이에대한 간단한 실험과 효율적 방법에 대해서 포스팅해본다. 1. 데이터 준비 실험 및 예시에서 사용될 데이터는 seaborn에서 제공하는 "taxis" 샘플을 사용한다. 14개의 컬럼으로 구성되어 있으며 여러 타입의 데이터가 존재한다. import seaborn as sns df = sns.load_dataset('taxis') df.info() seaborn에서 제공하는 데이터 셈플에 대한 자세한 내..
-
Visual Studio Code 설치방법 및 기본 사용법(VScode)환경&시스템 구축 2022. 1. 24. 21:53
Visual Studio Code(이하 VScode)의 설치 방법 1. 설치 파일 다운로드 아래의 주소에서 자신의 환경에 맞는 설치 파일을 받는다. https://code.visualstudio.com/Download# 2. 인스톨 진행 3. VScode 실행 VScode 실행시 다음과 같은 화면을 볼 수 있다. 4. 파일 생성 or 파일 불러오기 상단 툴바에서 File > New File 메뉴를 통해서 새로운 파일을 생성 할 수 있다. (단축키 : ctrl+n) 생성된 파일에서는 언어 타입을 선택하라고 나오는데, Select a Language를 클릭하면 아래와 같이 언어를 고를 수 있다. 현재 포스팅 중인 컴퓨터에는 파이썬이 설치되어 있지 않는데, 친절하게 python을 설치할 것인지 메시지도 송출된..
-
[Window10] VirtualBox 다운로드 및 설치환경&시스템 구축/VMware 2021. 12. 9. 02:36
1. 설치파일 다운로드 아래의 주소로 들어가서 운영체제에 맞는 설치파일을 다운받아준다. https://www.virtualbox.org/wiki/Downloads Downloads – Oracle VM VirtualBox Download VirtualBox Here you will find links to VirtualBox binaries and its source code. VirtualBox binaries By downloading, you agree to the terms and conditions of the respective license. If you're looking for the latest VirtualBox 6.0 packages, see Virt www.virtualbox.or..
-
Ubuntu 18.04 LTS iso 파일 다운로드(우분투 18.04 LST)환경&시스템 구축/VMware 2021. 12. 8. 20:26
흔히 가상머신에 Ubuntu를 설치하기 위해서 사용되는 Ubuntu 18.04 LTS iso 파일을 받는 링크는 아래와 같습니다. (클릭하면 다운로드가 진행됩니다.) https://releases.ubuntu.com/18.04/ubuntu-18.04.6-desktop-amd64.iso 직접 홈페이지에서 받고 싶다면 아래의 링크로 들어가면 됩니다. https://releases.ubuntu.com/18.04/ Ubuntu 18.04.6 LTS (Bionic Beaver) Select an image Ubuntu is distributed on three types of images described below. Desktop image The desktop image allows you to try Ubu..