ADP 합격률이 1~3%라고 하면 처음엔 "그럼 사실상 불가능한 거 아닌가?"라는 생각이 들 수 있습니다. 하지만 합격률이 낮은 이유를 잘 보면, 제대로 된 준비 없이 응시하는 경우가 많기 때문이기도 해요. 실제 데이터 분析 경험을 쌓고, 방향을 잡고 체계적으로 준비한 사람들의 합격률은 이것보다 훨씬 높습니다.
이 글에서는 ADP를 처음 준비하는 분들이 가장 궁금해하는 것들 — 어떤 순서로 공부하는지, 필기에서 어디를 집중해야 하는지, 실기는 어떻게 접근하는지 — 을 현실적인 관점에서 정리했습니다.
1. 시작 전 체크: 나는 준비가 됐는가
ADP는 준비 없이 도전하면 시간만 낭비하는 시험입니다. 시작 전에 아래 항목을 솔직하게 체크해보세요.
| 체크 항목 | 없다면 |
|---|---|
| ✅ Python 또는 R로 데이터 전처리를 해본 경험 | 먼저 Python 기초 + pandas 학습 (2~3개월) |
| ✅ 회귀분析, 분류, 군집의 개념을 알고 있다 | 머신러닝 기초 강의 수강 후 시작 |
| ✅ 기초 통계(평균, 분산, 가설 검정) 이해 | ADsP 교재로 통계 기초 먼저 정리 |
| ✅ 응시 자격 충족 (학력+경력 또는 ADsP) | ADsP 먼저 취득 |
| ✅ 6개월 이상 꾸준히 공부할 수 있는 환경 | 단기 합격 기대하면 소모만 큼 |
Python을 아직 배우는 단계이거나 데이터 분析 프로젝트 경험이 전혀 없다면, ADP보다 빅데이터분析기사를 먼저 준비하세요. 빅데이터분析기사 실기를 준비하면서 코딩 실력과 분析 경험을 동시에 쌓을 수 있고, 그 경험이 ADP 실기 준비의 탄탄한 기반이 됩니다.
2. 필기 합격 전략
ADP 필기의 합격 기준은 70점입니다. 정보처리기사(60점)나 빅데이터분析기사(60점)보다 10점 높아요. 범위도 5과목에 서술형까지 있어서 단순 암기로는 부족합니다.
과목별 비중과 전략
| 과목 | 비중 | 전략 |
|---|---|---|
| 1과목 데이터 이해 | 10점 | 빅데이터 개념, 데이터 사이언스 정의 등 기본 개념 정리. ADsP 내용과 많이 겹침 |
| 2과목 데이터 처리 기술 | 10점 | SQL, Hadoop, NoSQL 개념. 실기 SQL 경험과 연결됨 |
| 3과목 데이터분析 기획 | 10점 | 분析 방법론(CRISP-DM, KDD 등), 분析 과제 정의, 성과 지표. 서술형 연습 병행 |
| 4과목 데이터분析 | 40점 | 전체의 절반. 통계, EDA, 머신러닝 알고리즘 심화. 가장 많은 시간 투자 |
| 5과목 데이터 시각화 | 10점 | 차트 종류, 시각화 원칙, 데이터 스토리텔링. 비교적 가볍게 접근 가능 |
| 서술형 | 20점 | 3과목 분析 방법론이나 4과목 알고리즘 설명. 핵심 개념을 글로 쓰는 연습 필수 |
✔ 4과목(40점) + 서술형(20점) = 60점이 기본. 여기서 42점 이상이면 나머지 과목에서 28점만 채우면 됨
✔ 1·2·5과목은 암기 비중이 높아 효율적으로 점수를 올릴 수 있음
✔ 서술형은 분析 방법론 용어 + 알고리즘 원리를 1~2문장으로 쓰는 연습을 매일 조금씩
✔ 기출 문제가 적으므로 교재 개념 이해 + 관련 논문·자료 읽기로 폭을 넓혀야 함
3. 4과목 데이터분析 집중 공략
4과목은 전체 필기의 절반을 차지하는 핵심입니다. 범위가 방대하지만 출제되는 영역은 어느 정도 패턴이 있습니다.
| 영역 | 주요 내용 | 공부 우선순위 |
|---|---|---|
| 탐색적 데이터 분析 (EDA) | 기술통계, 분포, 이상값, 결측값, 상관관계 | ★★★★★ |
| 통계적 검정 | t-검정, F-검정, 카이제곱, ANOVA, 비모수 검정 | ★★★★☆ |
| 회귀분析 | 단순/다중 회귀, 로지스틱 회귀, 변수 선택법 | ★★★★★ |
| 분류 알고리즘 | 의사결정나무, 랜덤포레스트, SVM, KNN, 나이브베이즈 | ★★★★★ |
| 군집 분析 | K-means, 계층적 군집, DBSCAN | ★★★★☆ |
| 앙상블 | 배깅, 부스팅(XGBoost, LightGBM), 스태킹 | ★★★★☆ |
| 모델 평가 | 혼동 행렬, 정밀도/재현율/F1, ROC-AUC, 교차 검증 | ★★★★★ |
| 차원 축소 | PCA, 요인 분析, t-SNE | ★★★☆☆ |
| 시계열 분析 | ARIMA, 계절성 분해, 자기상관 | ★★★☆☆ |
4. 실기 합격 전략
ADP 합격자 대부분은 "실기가 진짜 시험"이라고 말합니다. 4시간 동안 데이터셋 3개를 분析하는 과정이 실무와 거의 동일한 수준이에요. 단순히 코드를 외우는 게 아니라, 데이터를 보고 적절한 분析 방법을 선택하고, 결과를 해석하는 판단력이 필요합니다.
실기 시험 흐름
Step 1. 데이터 파악 (5~10분) — 변수 확인, 데이터 타입, 기본 통계 확인
Step 2. 전처리 (15~20분) — 결측값, 이상값, 인코딩, 정규화
Step 3. EDA (15분) — 분포, 상관관계, 주요 패턴 시각화
Step 4. 모델링 (20~25분) — 적절한 알고리즘 선택 및 학습
Step 5. 평가·해석 (15분) — 평가 지표 계산, 결과 해석 서술
실기 필수 코드 패턴 (Python 기준)
1. 손에 익을 때까지 코드 반복 실습 — 전처리, EDA, 모델링, 평가 각 단계 코드를 보지 않고 쓸 수 있을 만큼
2. 공개 데이터셋으로 분析 연습 — 캐글(Kaggle), UCI 머신러닝 저장소, K-Data 포털의 공개 데이터로 실전 감각 쌓기
3. 결과 해석 서술 연습 — 코드 결과값을 보고 "이 모델은 ~한 특성을 보이며, ~한 이유로 ~를 권장한다"처럼 비즈니스 언어로 해석하는 연습
5. R vs Python 선택과 준비법
실기에서 R과 Python 중 하나를 선택할 수 있습니다. 어느 것을 선택하든 합격에 유불리는 없지만, 자신에게 맞는 선택을 해야 합니다.
| 항목 | Python | R |
|---|---|---|
| 주요 라이브러리 | pandas, numpy, scikit-learn, matplotlib, seaborn | dplyr, ggplot2, caret, tidyr, randomForest |
| 장점 | 범용성 높음. 취업 시장에서 수요 더 많음. 학습 자료 풍부 | 통계 분析에 특화. 시각화(ggplot2)가 강력. 학계에서 많이 사용 |
| 단점 | 초보자에게 문법 체계가 낯설 수 있음 | Python보다 취업 시장에서 수요 낮음. 최근 활용도 감소 추세 |
| 추천 대상 | 취업·커리어 연계를 원하는 경우, 이미 Python을 쓰는 경우 | 통계 분析 위주 업무, 학술 연구 목적 |
✔ 이미 Python을 쓰고 있다면 → Python 그대로
✔ 아직 아무것도 모른다면 → Python 권장 (학습 자료, 취업 연계 모두 유리)
✔ 통계학/학술 배경이 있고 R이 익숙하다면 → R 선택도 충분히 유효
✔ 중요한 건 언어 선택이 아니라 그 언어로 전처리→모델링→해석을 얼마나 유연하게 할 수 있는가
6. 학습 일정 (6개월 플랜)
- ADsP 교재로 1~3과목 이론 빠르게 정리 (이미 ADsP 합격자라면 복습)
- Python 또는 R 기초 문법 + pandas/dplyr 데이터 다루기
- 통계 기초 복습: 기술통계, 분포, 가설 검정 개념
- 4과목 집중: 회귀, 분류, 군집, 앙상블, 모델 평가 이론 + 코드 실습
- 공개 데이터셋(Kaggle Titanic, House Prices 등)으로 분析 파이프라인 처음부터 끝까지 실습
- 시각화(matplotlib, seaborn / ggplot2) 자유롭게 다루기
- 필기 기출 문제 풀기 시작
- 필기 전 과목 정리 + 서술형 쓰기 연습 (매일 1개 이상)
- 실기 모의 시험: 타이머 4시간 켜고 처음 보는 데이터셋으로 전 과정 수행
- XGBoost, LightGBM, 시계열(ARIMA) 등 심화 알고리즘 실습
- 필기 오답 최종 점검, 약점 과목 보완
- 실기 모의 시험 3회 이상 반복, 시간 배분 감각 익히기
- 결과 해석 서술 품질 점검 (논리적 흐름, 정확한 용어 사용)
- 시험 환경(IDE 없는 텍스트 에디터) 미리 체험
7. 자주 하는 실수
실수 1. 필기에만 집중하다 실기에서 무너진다
필기와 실기를 동시에 준비해야 합니다. 필기 합격 후 실기를 처음 준비하면 코딩 감각을 처음부터 쌓아야 하는데, 이 경우 2년이라는 실기 응시 유효 기간이 짧게 느껴집니다. 처음부터 코딩 실습을 병행하면서 공부하는 게 효율적입니다.
실수 2. 알고리즘 이론만 공부하고 코드를 안 짜본다
랜덤포레스트의 원리를 이론으로 아는 것과 실제로 코드를 짜서 결과를 해석하는 것은 전혀 다른 능력입니다. 실기는 이론 지식이 아니라 실행 능력을 보는 시험이에요. 주 3회 이상은 실제 데이터셋으로 코딩 실습을 해야 합니다.
실수 3. 결과 해석을 소홀히 한다
코드를 실행하고 숫자를 출력하는 건 절반입니다. ADP 실기에서는 "정확도가 0.87이다"가 아니라 "클래스 불균형이 있는 데이터에서 정확도보다 AUC와 재현율이 더 의미 있는 지표이며, 현재 모델은 재현율이 0.72로 ~한 비즈니스 맥락에서 개선이 필요하다"처럼 논리적으로 해석하는 능력도 채점됩니다.
✔ Kaggle에서 최소 3개 이상의 공개 대회 데이터를 처음부터 끝까지 분析해봄
✔ 분析 노트북(Jupyter/R Markdown)을 쓸 때 반드시 결과 해석을 글로 함께 작성하는 습관
✔ 타이머 켜고 4시간 안에 완료하는 실전 연습을 최소 5회 이상
✔ 코드를 외우는 게 아니라 흐름을 이해하고 상황에 맞게 변형할 수 있을 때까지 반복
마무리
ADP는 분명 어려운 시험입니다. 하지만 준비 방향이 명확하고, 실제 분析 실력을 함께 키우면서 준비한다면 충분히 합격할 수 있습니다. 합격 자체도 의미 있지만, ADP를 준비하는 6개월~1년의 과정에서 쌓이는 실전 데이터 분析 능력이 취업과 커리어에서 더 큰 자산이 됩니다. 단기 합격보다 실력 향상을 주목표로 삼고 준비하면 결과도 따라옵니다.