본문 바로가기

공부/AI

[자격증] 빅데이터분석기사 실기 합격 후기 (비전공자 문과)

빅데이터분석기사 자격증 실기 시험 합격 후기 (최종 합격 후기) 

✔ 시험 환경, 시험 준비, 기출문제 복원, 시험 결과 

 
 
지난 2021년 6월 19일에 있었던 제 2회 빅데이터 분석기사 실기시험의 결과가 오늘 발표되어 최종 합격하였다. 

 
 

📌 시험 응시 언어 및 환경


1. 언어 : 실기시험에서 파이썬과 R 중 선택할 수 있는데 일단 난 파이썬으로 응시했다.

2. 환경 : 클라우드 기반 IDE 환경으로 시험을 봐야하며 시각화가 불가능하다. 보통 데이터 분석을 하는 경우엔 Jupyter Notebook 등을 사용하여 라인별 실행을 하고 자동 완성 기능을 자주 사용하게 되는데 그런 기능은 불가능하니 시험 전 반드시 IDE환경으로 연습을 해봐야 한다. 시험 중 메모장은 사용 가능하기 때문에 작업형 풀 때 아이디어를 중간중간 적어놓을 수 있다.

3. 주의사항 : 오픈북이 아니므로 사용할 라이브러리와 코드를 잘 숙지해가야 한다. 라이브러리에 대한 정보가 잘 기억이 나지 않는 경우 help() 함수와 dir() 함수를 사용할 수 있다. 사실 난 이전에 주피터 노트북의 자동완성 기능을 사용했었기 때문에 이 함수들을 사용해본 적이 잘 없었는데, 이 시험에선 help() 함수와 dir() 함수가 생각보다 정말 유용하게 사용된다.

4. 시험 환경을 체험해볼 수 있는 사이트
구름devth (https://devth.goorm.io/)
온코더 (https://www.oncoder.com/ground/r1KQacTxQ)
프로그래머스 (https://programmers.co.kr/learn/challenges)
 
 


📌 시험 준비


이 시험은 2회차이지만 지난 1회차가 코로나로 인해 취소되어 사실상 첫 시험이기 때문에 기출문제가 없었다. 또한 첫 시험이다보니 필기 시험에서 시중 문제집들의 적중률이 크게 떨어져서인지 문제집 회사들은 이번 실기 시험 문제집을 출간하지 않았다. 따라서 따로 공부할 교재는 없었으며 그 대신 시험 출제기관인 한국 데이터산업 진흥원에서 제공한 예상문제가 있어서 시험 전 예상문제를 풀어보았다.

예상문제 

 
 


📌 총 공부 기간

 
빅데이터 분석기사 실기시험 3일 전부터 공부를 시작했다. 사실 공부기간을 더 투입하고 싶어도, 첫 시험인지라 시중 문제집도 없고 기출문제도 없었기에 공부기간이 짧을 수밖에 없었다. 그리고 예상문제는 데이터산업 진흥원에서 공개한 각 유형별 1개씩의 문제만 있었기 때문에, 3일동안 작업형1과 작업형2를 반복적으로 풀어보는 방식으로 공부했다. 
 



📌 출제 경향 (기출 문제 복원) 


1. 단답형
한 문항당 3점씩 10개 문항이 출제된다. 솔직히 단답형을 가장 걱정했는데 필기시험에 출제된 개념 위주로 나와서 다행이었다. 참고로 단답형 답 복원은 아래의 게시글에서 확인할 수 있다. 
https://cafe.naver.com/sqlpd/21420

단답형 답 맞춰봐요(이렇게 했으면 몇점일까요..?)

순서는 정확히 기억은 안납니다만.. 이상치 평균대체법 -> 평균대치법 비지도학습 부스팅 하이퍼파라미터 gradientboosting 오버피팅 0.03 -> -1 후진제거법 ...

cafe.naver.com



2. 작업형 1
한 문항당 10점씩 3개 문항이 출제된다. 데이터가 주어지면 해당 데이터를 바탕으로 문제를 풀면 된다. 전처리에 필요한 작업들을 잘 수행할 수 있는지 테스트하는 듯 하다. 내 기억으로 시험에서 출제된 문제는 다음과 같았다. 

작업형 1 기출문제 

1) 주어진 데이터셋의 컬럼1에서 상위 10개의 데이터에 대하여 10개 중 최솟값으로 대체한 후, 컬럼2에서 값이 80 이상인 데이터들 중 컬럼1의 평균값 구하기 

2) 주어진 데이터셋 중 앞에서부터 80% 데이터를 샘플링하여 특정 컬럼의 표준편차를 구하고, 해당 컬럼에서 결측치를 중앙값으로 대체한 후 표준편차를 구하여 그 두가지 표준편차의 차이 구하기

3) 주어진 데이터셋에서 특정 컬럼의 이상치를 IQR rule에 의해 탐지하고 이상치들의 합을 구하기 



3. 작업형 2
배점 40점의 1개 문항이 출제된다. 데이터가 주어지면 해당 데이터를 바탕으로 필요한 전처리와 feature engineering, 모델링(앙상블 기법 사용), 하이퍼 파라미터 최적화, 교차검증 등을 수행한다. 내 기억으로 시험에서는 배송이 지연될지 안될지에 대한 여부를 예측하는 문제가 나왔다. 데이터셋에서 운송수단, 창고 종류, 택배 회사와의 연락 여부, 이전에 택배를 주문한 적이 있었는지 여부, 금액 할인을 얼마나 받았는지 등의 컬럼이 주어졌고 배송이 지연될 확률을 구하면 되었다. 또한 성능 지표는 데이터 진흥원에서 공개했었던 예상문제와 동일하게 ROC-AUC로 평가한다고 되어 있었다. 
원래 캐글이나 데이콘 등에서 대회에 참가해본 경험이 있는 사람이라면 데이터 전처리부터 모델링까지 해보았을 것이므로 어렵지 않게 풀 수 있는 문제였다.

 


📌 결과

단답형 24/30, 작업형 제1유형 30/30, 작업형 제2유형 40/40 으로 결과는 총점 94점으로 합격하였다. 🎉
과락기준은 없으며 총점 60점을 넘으면 합격한다. 이번이 첫 시험이라 그런지 난이도를 무난하게 출제한 것 같다고 느꼈다.
필기시험에 합격하였다면 단답형은 따로 준비할 필요가 없을 것 같고 작업형 1과 작업형 2 같은 경우에는 평소에 전처리부터 모델링까지 직접 코드를 치면서 연습해보고 예상문제를 스스로 변형가면서 풀어보기를 추천한다. 이 글을 보신 분들도 꼭 한번에 합격하시길 기원!
 
 


 
필기 합격 후기는 여기로 ↓
[자격증] 빅데이터분석기사 필기 합격 후기 (비전공자 문과)

반응형