자격증/빅데이터분석기사
-
[빅데이터분석기사] 실기시험 모의고사 1자격증/빅데이터분석기사 2021. 11. 29. 23:06
이 포스팅은 빅데이터분석기사 실기시험을 가정하고 직접 만든 모의고사임을 밝힙니다. 모의고사이지만 연습을 가정하고 만들었기 때문에 실제 시험보다 문항수가 많습니다. 실제 실기시험에서는 단답식 이론문제도 나오지만 해당 포스팅에서는 다루지 않습니다. 0. 데이터준비 해당 코드는 시험과 유사하게 데이터를 준비하는 과정이며 시험과 전혀 관계없습니다. 실제 시험에서는 train셋과 test셋이 바로 제공됩니다. 아래 코드를 단순히 복사붙여넣기 하시기바랍니다. import seaborn as sns df = sns.load_dataset('penguins').sample(frac=1).reset_index(drop=True) df['bill_depth_mm'] = df['bill_depth_mm'].apply(lam..
-
빅데이터분석기사 실기 연습예제 - 2. 예측 모델 생성자격증/빅데이터분석기사 2021. 8. 24. 16:15
빅데이터분석기사 실기 시험을 보고나서 후배들에게 도움을 주고자 만들게 된 예시입니다. 첫 시험(2회차, 1회는 캔슬)이라 상대적으로 쉬었을 수도 있지만 다음 차수도 이번 난이도와 같다는 가정하에 작성하였습니다. 0. 데이터 준비 데이터는 널리 쓰이는 Titanic 데이터를 사용하며 다운로드 경로는 아래와 같다. https://www.kaggle.com/c/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 해당 데이터는 타이타닉호에 탑승한 승객들의 데이터이며 생존여부(Survived)를 정답값으로 가진다. train, test 데이터셋을 사용하며, 실제 시험 및 대회등과 동일한 환경을 구축하기위해 submit 셋을 만든다. t..
-
빅데이터분석기사 실기 연습예제 - 1. 데이터 전처리자격증/빅데이터분석기사 2021. 8. 23. 13:34
빅데이터분석기사 실기 시험을 보고나서 후배들에게 도움을 주고자 만들게 된 예시입니다. 첫 시험(2회차, 1회는 캔슬)이라 상대적으로 쉬었을 수도 있지만 다음 차수도 이번 난이도와 같다는 가정하에 작성하였습니다. 데이터 준비 데이터는 널리 쓰이는 Titanic 데이터를 사용하며 다운로드 경로는 아래와 같다. https://www.kaggle.com/c/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 해당 데이터는 타이타닉호에 탑승한 승객들의 데이터이며 생존여부(Survived)를 정답값으로 가진다. 본 포스팅에서는 데이터 전처리가 목적이므로 train.csv만 활용한다. 라이브러리 선언 import pandas as pd i..
-
빅데이터분석기사 2회 실기 합격 후기 및 꿀팁자격증/빅데이터분석기사 2021. 8. 23. 09:36
빅데이터분석기사 2회차 시험에서 최종 합격을 하였습니다. 실기 점수는 97점으로 단답형에서 한문제 미스가 난 것 같습니다. 구성 실기의 경우 단답, 작업1, 작업2로 구성되어있습니다. 단답형은 이상치, 결측치, 평군대치, 부스팅, 과적합 등의 데이터 분석 분야의 기본적인 지식을 물어보는 수준이라 어렵지 않았습니다. 작업1은 데이터 핸들링을 요구하는 문제로, 계산 및 변환(이상치, 스케일링) 등을 요구하였습니다. 작업2는 주어진 데이터로 예측모델 생성 및 학습을 요구하였으며 자연스럽게 데이터의 전처리도 요구하였습니다. 난이도 시험의 난이도의 경우 데이터 분석에 대한 경험(과제, 경진대회, 프로젝트 등) 또는 sklearn의 사용경험이 있다면 충분히 풀 수 있는 수준이었습니다. 예측모델은 저의 경우 xgbo..