본문 바로가기

Stack/AWS

[AWS DEA] 시험 합격을 위한 완전 가이드1 (feat.Gemini Pro 3.1)

반응형
AWS DEA-C01 완벽 대비

AWS Data Engineer Associate 시험
핵심 서비스와 문제 패턴으로 합격하는 가이드

AWS Data Engineer Associate(DEA-C01) 시험을 준비하는 분들을 위해 핵심 데이터를 실생활 비유로 설명하고, 시험에 자주 등장하는 문제 패턴과 아키텍처 흐름을 한 번에 정리했습니다.

💡 합격 관점 핵심 프레임

  • 데이터가 들어온다 → 저장한다 → 정제한다 → 분석한다 → 보호한다.
  • 서비스 이름보다 “언제 무엇을 고르는가”가 더 중요합니다.
  • 문제는 대부분 성능·비용·운영성·보안의 균형을 묻습니다.

1️⃣ AWS DEA 핵심 용어 정리 (실생활 비유)

시험에서 서비스 이름을 보고 바로 기능이 떠오르지 않으면 선택지가 흔들립니다. 자주 나오는 서비스를 “현실 세계 역할”로 연결했습니다.

서비스/개념 실생활 비유 시험 핵심 포인트
Amazon S3 모든 박스를 쌓아두는 초대형 창고 데이터 레이크 기본 저장소. 싸고 확장 용이
S3 Glacier 오래된 서류를 넣는 외곽 보관 창고 즉시 안 쓰는 장기보관 데이터
Amazon Athena 창고 안가고 재고 목록만 보는 직원 S3 데이터 SQL 즉시 조회. 서버 운영 없음
AWS Glue 물건을 분류·세척하는 자동 정리팀 ETL, 크롤러, 데이터 카탈로그의 핵심
Amazon EMR 공장을 빌려 대용량 작업을 돌리는 라인 Spark/Hadoop 등 빅데이터 프레임워크 필요시
Amazon Redshift 분석가 전용 초고속 자료실 대규모 분석용 데이터 웨어하우스(DW)
Kinesis Streams 실시간 데이터 전용 고속도로 실시간 수집. 샤드 및 처리량 제어
Kinesis Firehose 목적지로 배송해주는 자동 택배 라인 스트리밍 데이터를 S3/Redshift에 자동 적재
AWS Lambda 이벤트가 생기면 튀어나오는 로봇 서버리스 짧은 작업. 이벤트 기반 파이프라인
Lake Formation 구역을 관리하는 중앙 보안팀장 데이터 레이크 권한 및 거버넌스 제어

2️⃣ 자주 등장하는 AWS 서비스 60개 구조

합격 효율 관점에서는 서비스를 흐름상의 역할로 묶어 이해하는 것이 좋습니다.

📥 수집 및 스트리밍
  • Kinesis (Streams, Firehose, Analytics)
  • Amazon MSK (Kafka)
  • AWS DMS, SCT (마이그레이션)
  • DataSync, Transfer Family
  • Amazon AppFlow, API Gateway
💾 저장 및 데이터베이스
  • Amazon S3, Glacier, EBS, EFS
  • DynamoDB (NoSQL)
  • RDS, Aurora (관계형)
  • Neptune (그래프), DocumentDB
⚙️ 처리 (ETL) 및 컴퓨트
  • AWS Glue (Data Catalog, Crawler)
  • Amazon EMR (Hadoop, Spark)
  • AWS Lambda, Batch
  • EC2, ECS, EKS
📊 분석 및 시각화
  • Amazon Athena
  • Amazon Redshift (Spectrum, RA3)
  • OpenSearch Service
  • Amazon QuickSight
🎼 오케스트레이션
  • AWS Step Functions
  • Amazon MWAA (Airflow)
  • EventBridge, SQS, SNS
🔒 보안 및 거버넌스
  • AWS Lake Formation, IAM
  • KMS, Secrets Manager
  • Amazon Macie, CloudTrail
  • CloudWatch, AWS Config

3️⃣ 반드시 숙지해야 할 오답 제거 팁

핵심 판단 기준
  • 실시간 vs 배치: 즉시 반응(Kinesis/Lambda) vs 모아서 처리(S3/Glue)
  • 운영 부담 최소화: 서버리스가 강세 (Athena, Glue, Firehose)
  • 비용 최적화: Parquet/ORC 압축 + 날짜 파티션 조합 단골 출제
자주 틀리는 함정
  • 단순 S3 SQL 조회인데 굳이 EMR을 고르는 경우 (정답: Athena)
  • 실시간 자동 적재에 Streams를 고르는 경우 (정답: Firehose)
  • 데이터 레이크 세밀 권한에서 IAM만 보고 Lake Formation을 놓치는 경우

4️⃣ 3일 합격 공부 전략

DAY 1. 뼈대 잡기 (핵심 서비스 15개)
S3, Athena, Glue, Redshift, Kinesis(Streams/Firehose), Lambda, Lake Formation의 역할을 우선 장악하세요.

DAY 2. 확장과 함정 정리
EMR, DMS, Macie, Secrets Manager 등을 정리하고, Parquet/ORC 변환 및 파티셔닝 전략을 집중적으로 외우세요.

DAY 3. 시험형 사고 만들기
"왜 정답이 아닌가" 기준으로 오답 노트를 작성하세요. 최소한 4개 보기 중 2개를 빠르게 지우는 논리를 연습해야 합니다.

반응형