빅분기 실기
-
빅데이터분석기사 실기 연습예제 - 2. 예측 모델 생성자격증/빅데이터분석기사 2021. 8. 24. 16:15
빅데이터분석기사 실기 시험을 보고나서 후배들에게 도움을 주고자 만들게 된 예시입니다. 첫 시험(2회차, 1회는 캔슬)이라 상대적으로 쉬었을 수도 있지만 다음 차수도 이번 난이도와 같다는 가정하에 작성하였습니다. 0. 데이터 준비 데이터는 널리 쓰이는 Titanic 데이터를 사용하며 다운로드 경로는 아래와 같다. https://www.kaggle.com/c/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 해당 데이터는 타이타닉호에 탑승한 승객들의 데이터이며 생존여부(Survived)를 정답값으로 가진다. train, test 데이터셋을 사용하며, 실제 시험 및 대회등과 동일한 환경을 구축하기위해 submit 셋을 만든다. t..
-
빅데이터분석기사 실기 연습예제 - 1. 데이터 전처리자격증/빅데이터분석기사 2021. 8. 23. 13:34
빅데이터분석기사 실기 시험을 보고나서 후배들에게 도움을 주고자 만들게 된 예시입니다. 첫 시험(2회차, 1회는 캔슬)이라 상대적으로 쉬었을 수도 있지만 다음 차수도 이번 난이도와 같다는 가정하에 작성하였습니다. 데이터 준비 데이터는 널리 쓰이는 Titanic 데이터를 사용하며 다운로드 경로는 아래와 같다. https://www.kaggle.com/c/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 해당 데이터는 타이타닉호에 탑승한 승객들의 데이터이며 생존여부(Survived)를 정답값으로 가진다. 본 포스팅에서는 데이터 전처리가 목적이므로 train.csv만 활용한다. 라이브러리 선언 import pandas as pd i..
-
빅데이터분석기사 2회 실기 합격 후기 및 꿀팁자격증/빅데이터분석기사 2021. 8. 23. 09:36
빅데이터분석기사 2회차 시험에서 최종 합격을 하였습니다. 실기 점수는 97점으로 단답형에서 한문제 미스가 난 것 같습니다. 구성 실기의 경우 단답, 작업1, 작업2로 구성되어있습니다. 단답형은 이상치, 결측치, 평군대치, 부스팅, 과적합 등의 데이터 분석 분야의 기본적인 지식을 물어보는 수준이라 어렵지 않았습니다. 작업1은 데이터 핸들링을 요구하는 문제로, 계산 및 변환(이상치, 스케일링) 등을 요구하였습니다. 작업2는 주어진 데이터로 예측모델 생성 및 학습을 요구하였으며 자연스럽게 데이터의 전처리도 요구하였습니다. 난이도 시험의 난이도의 경우 데이터 분석에 대한 경험(과제, 경진대회, 프로젝트 등) 또는 sklearn의 사용경험이 있다면 충분히 풀 수 있는 수준이었습니다. 예측모델은 저의 경우 xgbo..