본문 바로가기
데이터 분석

ADP 34회 실기 합격 후기

by Dam_ 2025. 5. 26.

ADP 34회 실기 시험에 합격했습니다.  

 


목차

  • ADP 실기가 요구하는 능력
  • 가상환경에 대한 의견
  • 오픈북 자료(코드북)는 어떻게 제작하였나
  • 공부 기간과 학습 계획 설정
  • 스터디의 필요성
  • 시험장에서의 문제 해석과 시간관리

ADP 실기가 요구하는 능력

  이 시험에서 요구하는 능력치는 이론적 지식+통찰력 및 해석능력+고급 전처리 포함 코딩능력인 것 같습니다. 저는 특히 3번째 능력이 많이 부족한 상태로 이 시험을 준비했는데, 제 스스로의 단점이 많이 보완되었다고 느낍니다.

  • 이론적 지식

  해당 능력이 출중한 분들이 워낙 많은 것 같습니다. ADsP 응시 인원 및 합격률이 상당하더군요. 나아가 빅분기, ADP 필기를 합격하셨다면 부족하다고 생각되진 않습니다.

  특정 모델의 가정, 이론적 배경, 장단점 등등은 문제 풀면서 그때그때 정리해 나가면 될 것 같습니다. 유용한 서적들을 참고해도 좋고요. 참고서적은 네이버의 '데이터 전문가 포럼' 카페의 지난 후기글들을 확인하시는 것이 좋을 것 같습니다.

  • 통찰력 및 해석능력

  경험과 연습으로 기를 수 있는 능력입니다. 하지만 합격을 위해 경험을 쌓고 오라는 말은 아닙니다. 

  해결책 → 카페 스터디를 통한 의견 교환을 통해 많은 도움을 받을 수 있습니다. 다양한 경험들을 가진 팀원들이 모여, 각자의 관점으로 문제를 해석해나가게 됩니다. 실기 기출 복원문제를 함께 풀고, 의견을 공유하며 토론하는 것이 많은 도움이 됩니다.

또한 여러 서적이나 강의로 보완할 수 있다고 지난 후기들에서 봤던 것 같습니다.

  • 고급 전처리 포함 코딩능력

  저의 가장 큰 약점이었습니다. 작년 하반기 빅분기 실기 칠 때까지만 해도 R로 응시했구요, 통계학과 출신이라 R 80%, 파이썬 20% 정도 사용 경험이 있으나 여러 프로젝트를 할 때에도 코딩을 메인으로 하진 않았습니다. 그래서 둘 다 이도저도 아닌 실력이었다고 생각합니다. 이참에 파이썬을 제대로 해봐야겠다, 생각하고 파이썬으로 결정했습니다. pd.iloc, loc의 차이, drop 등 처음부터 시작했습니다.

  해결책→ 스터디 과제를 잘 구현해내는것부터 시작해서, 코드북을 만들어가고, 코드북을 기반으로 기출을 풀 수 있게끔 했습니다. 스터디 들어가시면, 다들 코딩을 잘하셔서, 높은 요구치에 부응하기 위해 열심히 하게 되더라고요.

 


가상환경에 대한 의견

  시험장 환경(시험장의 파이썬 버전 및 패키지 버전)으로 설정하는 것이 나은지에 대한 질문이 카페에 있더라고요. 저는 why not? 이라고 생각합니다. 구현 방법을 모른다면 어쩔 수 없지만, 방법이 공유가 되었다면 하지 않을 이유가 없다고 생각해요.

제가 작성한 글에 가상환경 구현 방법이 있지만, 왜 그렇게 해야하는지에 대해서…

  1. GPT도 없이, 시간이 부족한 실기 시험에서 맞닥뜨릴 수 있는 가장 큰 시련은 오류입니다(준비하지 않은 내용이 나온 것은 어쩔 수가 없죠).
  2. 패키지 버전별로 함수의 이름, 인자의 이름, 디테일 설정 등이 다릅니다.
  3. 그렇다면 가져갈 코드북은 어떤 환경을 기준으로 제작할 것인가요?

  처음에 시험장 설정(데이터 진흥원 공지사항에서 제공)에 맞추기 위해, 아나콘다 내비게이터로 개별 패키지 버전을 설정하려고 시도했습니다. 결과는 실패였는데요, 패키지별로 호환되는 버전이 있으나 시험장 버전들은 서로 충돌이 생겼습니다.

데이터산업진흥원에 문의한 결과, 답변은 다음과 같습니다.

  시험장의 파이썬 버전은 3.7이나, 3.8로 업그레이드하든가, pip로 설치하는 방법이 답변으로 돌아왔습니다. 그렇다면 pip를 사용해서 시험장 버전의 패키지를 일괄 설치하는 방법이 필요하겠죠? 블로그에 정리해 놓았으니, 참고하시길 바랍니다.

ADP 실기 환경 세팅(파이썬 가상환경, pip)

 

ADP 실기 환경 세팅(파이썬 가상환경, pip)

ADP 실기시험은 한국데이터 진흥원에서 제공하는 환경에서 실시됩니다. 파이썬 3.7이 설치되어 있으며, 그에 맞게 다양한 패키지들이 다운그레이드된 상태입니다(ex. numpy 1.21.6). 당장 지피티에게

well-being-stat.tistory.com


오픈북 자료(코드북)는 어떻게 제작하였나

  ChatGPT 켜놓고, 아래와 같이 프롬프트를 사전에 설정해놓은 뒤에 기출 풀면서 그때그때 하나씩 내용 추가했습니다. 그때그때 세부적으로 조정했지만 큰 틀은 같습니다. 저보다 능숙하신 분들이 많으니 참고만 하시면 될 것 같습니다.

ex) 기출에 SMOTE가 나왔다 → 샘플링 기법 중 나올 가능성이 높은 기법들 모두 정리

→’ 가능성이 높다’의 기준? : GPT와 대화하여 ‘일반적으로 많이 사용되는가?’를 물어보기도 하고, 스터디를 통해 다른 분들이 사용한 기법들은 정리하는 방향으로 범위를 조정했습니다.

  위의 페이지를 모두 html로 저장→크기 조절 후 pdf로 저장→출력했습니다(노션에 작성한 코드가 깨지지 않도록, 배율은 60% 정도). 세부 목차마다 포스트잇 플래그 붙여서 찾기 쉽게 정리했습니다.

  들고 간 출력물은 합쳐서 250p는 넘었던 것 같습니다. 교재는 조정임 저 ‘통계와 머신러닝 파이썬 코드북’을 들고 갔지만 펴보지는 않고, 부적처럼 놔뒀습니다. 시험에서는 제가 작성한 코드북으로만 해결했습니다.

  시험 며칠 전에 로지스틱 회귀가 어렵게 나오지 않을까, 예상하고 정말 딥하게 정리했던 기억이 있네요. 34회에는 나오지 않았습니다. 목차를 보시면 고수분들은 중복되는 걸로 보이는 제목들이 있다고 느끼실 수 있는데요, 실제로 몇몇 내용은 중복되게 넣었습니다. 필요할 때 찾기 쉬운 게 중요하지, 코드북의 무결성은 중요하지 않다고 생각했거든요..^^

  코드북의 세부 내용 공유 생각은 없습니다. 제가 특별한 비법을 가져서가 아니라, 프롬프트로 다 출력될 내용들이기도 하고, 본인이 정리해야 오픈북 시험을 오픈북 시험답게 해결할 수 있기 때문입니다.

들고간 코드북


공부 기간과 학습 계획 설정

  준비하는 사람마다 여유 시간이 다르고, 목적의식도 다르니 일률적인 정답이 없는 부분입니다만은, 제 케이스를 어떻게 해석할 지에 대해 단서를 제공한다고 생각하고 제 백그라운드를 알려드리겠습니다.

[백그라운드]

  • 통계학과 전공 및 소비자학과 복수전공
  • 학부시절 데이터 관련 프로젝트 다수, 공모전 다수 수상
  • 통계 석사 진학을 염두에 두고 있었으나 사회복무하며 취업준비중

  24년도에 순차적으로 ADsP, BIS 필기, ADP 필기, BIS 실기(불합), 빅분기 필기, 빅분기 실기 응시 및 합격, 33회 실기는 준비가 안된 것 같아 응시하지 않았습니다(비싼 응시료…).

  ADP 실기는 올해 1월부터, 4월 26일 시험일까지 110일가량 준비했습니다. 평균적으로 매일 3시간 이상, 시험 한 달 전부터는 일 5시간 이상 투자하려 노력했습니다.

  • 예열 기간+코드북 제작(약 30일): 한 달 동안 시대에듀의 ‘파이썬 한 권으로 끝내기'를 스터디에서 공부했습니다. 코드북을 어떻게 제작할지, 파이썬에 익숙해지는 연습에 초점을 맞췄습니다.
  • 본격적인 기출문제 풀이+코드북 제작(약 60일): 데이터마님 사이트에 업로드된 기출문제를 매주 풀었습니다. 숙제로 정해진 회차를 풀고, 스터디 시간에 각자 풀이를 공유하는 시간을 가졌습니다. 업로드된 내용 중 수정할 부분이나 비어있는 파일의 경우 스터디원 분들의 도움을 많이 받았습니다. 기출 기반으로 코드북을 공격적으로 제작했습니다.
  • 최종점검 및 마지막 기출풀이(약 15일): 6일 정도는 초심으로 돌아가, 데이터 마님 사이트의 ‘전처리 100제 + 빅분기 실기 1유형 100제’를 풀었습니다. 제작한 코드북을 모두 출력한 다음, gpt 없이 코드북으로만 앞서 1회독했던 기출들을 순차적으로 풀었습니다. 이틀에 한 회정도 풀다가, 시험 직전 5일 동안은 매일 1회씩 풀어서 시험 전날 33회를 풀고 마무리했습니다. 해당 기간에 보완이 필요하다고 느낀 부분들은 추가로 정리 및 출력해서 시험장에 들고 갔습니다.

  저는 위와 같이 준비했습니다만은, 준비하시는 분들의 상황에 맞게 수용하시면 좋을 것 같습니다. 보통의 취준생이 따기엔 가성비가 나오지 않는 것은 사실인 것 같으나, 제 상황이 특수하여 자격증에 올인할 수 있었습니다.


스터디의 필요성

  데이터분석(머신러닝, 전처리 포함)의 Global optimum은 없습니다. 문제 해결 방법은 분석가마다 각자의 local optimum으로 수렴한다고 생각해요. 그렇기에 ADP 실기는 혼자서 준비하기가 참 어렵습니다. 시중에 나온 교재들도, 하나의 방향성만 해답으로 제시할 뿐 여러 관점으로 해석하는 것을 도와주지는 않는 것 같습니다.

  스터디를 통해, 여러 사람들의 관점을 비교하여 스스로의 관점을 다듬을 수 있습니다. 혼자서 정말 열심히 공부하더라도, 틀린 걸 틀린 줄 모르고 시험장에 간다면 얼마나 아쉬울까요.

  실기 시험에서 통계는 일률적인 정답이 있다고 생각합니다만, 세부적인 해석에 들어가면 또 갈립니다. 전처리는 global optimum이 존재하기는 하지만 모든 상황에서 global optimum을 제시할 수 있는 사람은 잘 없습니다. 여러 사람들의 local optimum을 기억하고 이해하는 과정이 도움이 되는 것 같습니다. 머신러닝은… 굳이 언급하지 않겠습니다.

  스터디에 임하는 태도: 최선을 다하려고 노력했습니다. 다른 분들이 발표하는 내용을 이해하고, 이해가 어렵다면 적절한 메모라도 하기 위해서는 제가 준비를 많이 해가야 합니다. 준비한 만큼 얻어갈 수 있다고 생각합니다.


시험장에서의 시간관리, 시험장 팁

  • 시험장에서의 시간관리

  가장 정석적인 방법은 통계→머신러닝 순서로 풀이하는 것입니다. 알면 풀고, 모르면 틀리는(요즘 추세는 조금 달라지는 것 같긴 합니다만은) 통계파트이기에 먼저 푸는 게 유리합니다. 1시간 이내에 다 푸는 것이 이상적입니다. 기존에 3문제였던 통계파트가 2문제로 줄었던 것이 34회의 특징이었습니다.

  머신러닝은 1번이 점수 비중이 더 크고 무거우며, 2번은 전처리가 복잡하고 모델링 요구사항은 비교적 간단합니다. 각각 1시간 반, 1시간을 할당한다고 생각하면 될 것 같습니다. 1번은 기억나지 않지만, 2번에서의 복잡한 전처리 과정은 점수가 배정되어있지 않습니다. 풀면서 참 불합리한 부분이라고 생각했었네요. 시간관리 잘하시어 포기할 거 포기하고 점수 획득에 초점을 맞추시길 바랍니다.

  ADP 실기는 요구사항도 많고, 전처리도 지독합니다. 의도 파악도 쉽지 않고, 긴장된 그 순간에 핵심 의도를 캐치하고 정답을 입력하는 게 쉽지가 않습니다. 내 눈이 한 번 놓친 실수를 다시 봤을 때 캐치하는 것 또한 정말 쉬운 일이 아닙니다. 그렇기에 운도 따라줘야 하고, 그날의 컨디션도 매우 중요한 시험입니다. 시험에서 실수해도 괜찮지만, 가능하면 준비 과정에서 최대한 많이 실패하고 실수해보시길 바랍니다. 

  • 시험장 팁

  저는 빅분기 볼 때처럼 시험환경이 불편할 줄 알았습니다. 그런데 막상 가니까 환경 점검시간(시험 시작 전) 주피터 노트북이 시작 이후에도 그대로 유지되는 시스템이고, 우리가 아는 주피터 노트북 그대로입니다.

  주피터 노트북은 뒤에서 유지되고, 시험 사이트(groom?)만 왔다 갔다 하며 사전테스트가 진행됩니다. 시험 시작하면 앞에서 띄워놨던 주피터 노트북이 유지된 상태이기에 필요한 코드를 미리 작성해 놓거나, 패키지를 불러오거나, 함수를 적어놓을 수도 있을 것 같습니다. 감독관마다 요구사항이 다를 수도 있지만, 제가 본 고사장은 그랬습니다. 

  또한 auto bracket(자동으로 괄호 닫아주기) 기능이 활성화된 상태였습니다. 저는 이 기능을 꺼놓고 연습했어서 실전에서 오히려 불편하더라고요. 이 부분은 다른 고사장도 같은지 기응시자분들의 정보 공유가 필요한 것 같습니다.

그리고 데이터 파일의 열 이름이 모두 영어였습니다. 한글 폰트와 관련해서 문의가 잦고, 문제가 생겨서 아예 영어로 하려는 것 같더라고요. 그래도 한글 관련 설정은 코드북에 적어가시는 것이 좋을 것 같긴 합니다.


마치며

  저는 경제적인 여유가 많은 편이 아니라, 최소한의 비용으로 준비했습니다. 교재(한 권으로 끝내기, 머신러닝 코드북)와 시험응시료를 제외하고는 gpt 구독료 정도 들었던 것 같네요. 여유가 된다면 슬기로운 통계생활이나 데이터마님의 강의 및 세미나가 도움이 된다고 하니 잘 알아보시길 바랍니다.

  준비기간이 짧다면 짧지만 간절하게 공부했던 것 같습니다. 또한 합격률이 굉장히 낮은 만큼, 마인드 컨트롤을 열심히 했습니다. 마치 붙을 사람인 것처럼- 열정, 긍정적인 마인드셋을 유지하며 준비했습니다.

  합격 이후에도 제 일상의 변화는 없으나 데이터 분석에 필요한 여러 요소들 중 부족했던 부분들이 굉장히 많이 보완된 것 같습니다.ㅎㅎ

여러분도 좋은 결과 있기를 바랍니다.

'데이터 분석' 카테고리의 다른 글

ADP 34회 실기 문제 복기  (0) 2025.04.26
ADP 실기 환경 세팅(파이썬 가상환경, pip)  (3) 2025.02.23