ADP 합격률이 1~3%라고 하면 처음엔 "그럼 사실상 불가능한 거 아닌가?"라는 생각이 들 수 있습니다. 하지만 합격률이 낮은 이유를 잘 보면, 제대로 된 준비 없이 응시하는 경우가 많기 때문이기도 해요. 실제 데이터 분析 경험을 쌓고, 방향을 잡고 체계적으로 준비한 사람들의 합격률은 이것보다 훨씬 높습니다.

이 글에서는 ADP를 처음 준비하는 분들이 가장 궁금해하는 것들 — 어떤 순서로 공부하는지, 필기에서 어디를 집중해야 하는지, 실기는 어떻게 접근하는지 — 을 현실적인 관점에서 정리했습니다.

1. 시작 전 체크: 나는 준비가 됐는가

ADP는 준비 없이 도전하면 시간만 낭비하는 시험입니다. 시작 전에 아래 항목을 솔직하게 체크해보세요.

체크 항목없다면
✅ Python 또는 R로 데이터 전처리를 해본 경험먼저 Python 기초 + pandas 학습 (2~3개월)
✅ 회귀분析, 분류, 군집의 개념을 알고 있다머신러닝 기초 강의 수강 후 시작
✅ 기초 통계(평균, 분산, 가설 검정) 이해ADsP 교재로 통계 기초 먼저 정리
✅ 응시 자격 충족 (학력+경력 또는 ADsP)ADsP 먼저 취득
✅ 6개월 이상 꾸준히 공부할 수 있는 환경단기 합격 기대하면 소모만 큼
⚠️ 이런 분은 ADP보다 빅데이터분析기사를 먼저 권장
Python을 아직 배우는 단계이거나 데이터 분析 프로젝트 경험이 전혀 없다면, ADP보다 빅데이터분析기사를 먼저 준비하세요. 빅데이터분析기사 실기를 준비하면서 코딩 실력과 분析 경험을 동시에 쌓을 수 있고, 그 경험이 ADP 실기 준비의 탄탄한 기반이 됩니다.

2. 필기 합격 전략

ADP 필기의 합격 기준은 70점입니다. 정보처리기사(60점)나 빅데이터분析기사(60점)보다 10점 높아요. 범위도 5과목에 서술형까지 있어서 단순 암기로는 부족합니다.

과목별 비중과 전략

과목비중전략
1과목 데이터 이해10점빅데이터 개념, 데이터 사이언스 정의 등 기본 개념 정리. ADsP 내용과 많이 겹침
2과목 데이터 처리 기술10점SQL, Hadoop, NoSQL 개념. 실기 SQL 경험과 연결됨
3과목 데이터분析 기획10점분析 방법론(CRISP-DM, KDD 등), 분析 과제 정의, 성과 지표. 서술형 연습 병행
4과목 데이터분析40점전체의 절반. 통계, EDA, 머신러닝 알고리즘 심화. 가장 많은 시간 투자
5과목 데이터 시각화10점차트 종류, 시각화 원칙, 데이터 스토리텔링. 비교적 가볍게 접근 가능
서술형20점3과목 분析 방법론이나 4과목 알고리즘 설명. 핵심 개념을 글로 쓰는 연습 필수
🎯 필기 70점 확보 전략
✔ 4과목(40점) + 서술형(20점) = 60점이 기본. 여기서 42점 이상이면 나머지 과목에서 28점만 채우면 됨
✔ 1·2·5과목은 암기 비중이 높아 효율적으로 점수를 올릴 수 있음
✔ 서술형은 분析 방법론 용어 + 알고리즘 원리를 1~2문장으로 쓰는 연습을 매일 조금씩
✔ 기출 문제가 적으므로 교재 개념 이해 + 관련 논문·자료 읽기로 폭을 넓혀야 함

3. 4과목 데이터분析 집중 공략

4과목은 전체 필기의 절반을 차지하는 핵심입니다. 범위가 방대하지만 출제되는 영역은 어느 정도 패턴이 있습니다.

영역주요 내용공부 우선순위
탐색적 데이터 분析 (EDA)기술통계, 분포, 이상값, 결측값, 상관관계★★★★★
통계적 검정t-검정, F-검정, 카이제곱, ANOVA, 비모수 검정★★★★☆
회귀분析단순/다중 회귀, 로지스틱 회귀, 변수 선택법★★★★★
분류 알고리즘의사결정나무, 랜덤포레스트, SVM, KNN, 나이브베이즈★★★★★
군집 분析K-means, 계층적 군집, DBSCAN★★★★☆
앙상블배깅, 부스팅(XGBoost, LightGBM), 스태킹★★★★☆
모델 평가혼동 행렬, 정밀도/재현율/F1, ROC-AUC, 교차 검증★★★★★
차원 축소PCA, 요인 분析, t-SNE★★★☆☆
시계열 분析ARIMA, 계절성 분해, 자기상관★★★☆☆

4. 실기 합격 전략

ADP 합격자 대부분은 "실기가 진짜 시험"이라고 말합니다. 4시간 동안 데이터셋 3개를 분析하는 과정이 실무와 거의 동일한 수준이에요. 단순히 코드를 외우는 게 아니라, 데이터를 보고 적절한 분析 방법을 선택하고, 결과를 해석하는 판단력이 필요합니다.

실기 시험 흐름

📊 실기 시험 4시간 흐름 (대문제 1개 기준 약 80분)

Step 1. 데이터 파악 (5~10분) — 변수 확인, 데이터 타입, 기본 통계 확인
Step 2. 전처리 (15~20분) — 결측값, 이상값, 인코딩, 정규화
Step 3. EDA (15분) — 분포, 상관관계, 주요 패턴 시각화
Step 4. 모델링 (20~25분) — 적절한 알고리즘 선택 및 학습
Step 5. 평가·해석 (15분) — 평가 지표 계산, 결과 해석 서술

실기 필수 코드 패턴 (Python 기준)

import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import classification_report, roc_auc_score # 데이터 로드 및 파악 df = pd.read_csv('data.csv') print(df.shape) print(df.dtypes) print(df.describe()) print(df.isnull().sum()) # 결측값 처리 df['col'].fillna(df['col'].median(), inplace=True) # 이상값 처리 (IQR) Q1, Q3 = df['col'].quantile([0.25, 0.75]) IQR = Q3 - Q1 df = df[(df['col'] >= Q1 - 1.5*IQR) & (df['col'] <= Q3 + 1.5*IQR)] # 학습/테스트 분리 X = df.drop('target', axis=1) y = df['target'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # 모델 학습 및 평가 model = RandomForestClassifier(n_estimators=100, random_state=42) model.fit(X_train, y_train) y_pred = model.predict(X_test) print(classification_report(y_test, y_pred)) print("AUC:", roc_auc_score(y_test, model.predict_proba(X_test)[:,1]))
💡 실기 합격을 위한 핵심 3가지
1. 손에 익을 때까지 코드 반복 실습 — 전처리, EDA, 모델링, 평가 각 단계 코드를 보지 않고 쓸 수 있을 만큼
2. 공개 데이터셋으로 분析 연습 — 캐글(Kaggle), UCI 머신러닝 저장소, K-Data 포털의 공개 데이터로 실전 감각 쌓기
3. 결과 해석 서술 연습 — 코드 결과값을 보고 "이 모델은 ~한 특성을 보이며, ~한 이유로 ~를 권장한다"처럼 비즈니스 언어로 해석하는 연습

5. R vs Python 선택과 준비법

실기에서 R과 Python 중 하나를 선택할 수 있습니다. 어느 것을 선택하든 합격에 유불리는 없지만, 자신에게 맞는 선택을 해야 합니다.

항목PythonR
주요 라이브러리pandas, numpy, scikit-learn, matplotlib, seaborndplyr, ggplot2, caret, tidyr, randomForest
장점범용성 높음. 취업 시장에서 수요 더 많음. 학습 자료 풍부통계 분析에 특화. 시각화(ggplot2)가 강력. 학계에서 많이 사용
단점초보자에게 문법 체계가 낯설 수 있음Python보다 취업 시장에서 수요 낮음. 최근 활용도 감소 추세
추천 대상취업·커리어 연계를 원하는 경우, 이미 Python을 쓰는 경우통계 분析 위주 업무, 학술 연구 목적
🎯 현실적인 선택 기준
✔ 이미 Python을 쓰고 있다면 → Python 그대로
✔ 아직 아무것도 모른다면 → Python 권장 (학습 자료, 취업 연계 모두 유리)
✔ 통계학/학술 배경이 있고 R이 익숙하다면 → R 선택도 충분히 유효
✔ 중요한 건 언어 선택이 아니라 그 언어로 전처리→모델링→해석을 얼마나 유연하게 할 수 있는가

6. 학습 일정 (6개월 플랜)

📅 1~2개월차: 기반 다지기
  • ADsP 교재로 1~3과목 이론 빠르게 정리 (이미 ADsP 합격자라면 복습)
  • Python 또는 R 기초 문법 + pandas/dplyr 데이터 다루기
  • 통계 기초 복습: 기술통계, 분포, 가설 검정 개념
📅 3~4개월차: 4과목 심화 + 실기 입문
  • 4과목 집중: 회귀, 분류, 군집, 앙상블, 모델 평가 이론 + 코드 실습
  • 공개 데이터셋(Kaggle Titanic, House Prices 등)으로 분析 파이프라인 처음부터 끝까지 실습
  • 시각화(matplotlib, seaborn / ggplot2) 자유롭게 다루기
  • 필기 기출 문제 풀기 시작
📅 5개월차: 필기 마무리 + 실기 강화
  • 필기 전 과목 정리 + 서술형 쓰기 연습 (매일 1개 이상)
  • 실기 모의 시험: 타이머 4시간 켜고 처음 보는 데이터셋으로 전 과정 수행
  • XGBoost, LightGBM, 시계열(ARIMA) 등 심화 알고리즘 실습
📅 6개월차: 최종 정리 + 실전 대비
  • 필기 오답 최종 점검, 약점 과목 보완
  • 실기 모의 시험 3회 이상 반복, 시간 배분 감각 익히기
  • 결과 해석 서술 품질 점검 (논리적 흐름, 정확한 용어 사용)
  • 시험 환경(IDE 없는 텍스트 에디터) 미리 체험

7. 자주 하는 실수

실수 1. 필기에만 집중하다 실기에서 무너진다

필기와 실기를 동시에 준비해야 합니다. 필기 합격 후 실기를 처음 준비하면 코딩 감각을 처음부터 쌓아야 하는데, 이 경우 2년이라는 실기 응시 유효 기간이 짧게 느껴집니다. 처음부터 코딩 실습을 병행하면서 공부하는 게 효율적입니다.

실수 2. 알고리즘 이론만 공부하고 코드를 안 짜본다

랜덤포레스트의 원리를 이론으로 아는 것과 실제로 코드를 짜서 결과를 해석하는 것은 전혀 다른 능력입니다. 실기는 이론 지식이 아니라 실행 능력을 보는 시험이에요. 주 3회 이상은 실제 데이터셋으로 코딩 실습을 해야 합니다.

실수 3. 결과 해석을 소홀히 한다

코드를 실행하고 숫자를 출력하는 건 절반입니다. ADP 실기에서는 "정확도가 0.87이다"가 아니라 "클래스 불균형이 있는 데이터에서 정확도보다 AUC와 재현율이 더 의미 있는 지표이며, 현재 모델은 재현율이 0.72로 ~한 비즈니스 맥락에서 개선이 필요하다"처럼 논리적으로 해석하는 능력도 채점됩니다.

💡 합격자들이 공통적으로 하는 것
✔ Kaggle에서 최소 3개 이상의 공개 대회 데이터를 처음부터 끝까지 분析해봄
✔ 분析 노트북(Jupyter/R Markdown)을 쓸 때 반드시 결과 해석을 글로 함께 작성하는 습관
✔ 타이머 켜고 4시간 안에 완료하는 실전 연습을 최소 5회 이상
✔ 코드를 외우는 게 아니라 흐름을 이해하고 상황에 맞게 변형할 수 있을 때까지 반복

마무리

ADP는 분명 어려운 시험입니다. 하지만 준비 방향이 명확하고, 실제 분析 실력을 함께 키우면서 준비한다면 충분히 합격할 수 있습니다. 합격 자체도 의미 있지만, ADP를 준비하는 6개월~1년의 과정에서 쌓이는 실전 데이터 분析 능력이 취업과 커리어에서 더 큰 자산이 됩니다. 단기 합격보다 실력 향상을 주목표로 삼고 준비하면 결과도 따라옵니다.