S3 데이터 수명주기 3단계 — S3-IA + Glacier Flexible Retrieval + 삭제 조합이 정답인 이유
AWS DEA-C01 시험에 자주 나오는 S3 수명주기 비용 최적화 문제입니다. 0~3년 온라인 + SQL 분석 가능, 3~10년 12시간 내 복구, 10년 후 삭제 요건을 S3 Infrequent Access → Glacier Flexible Retrieval → 삭제 3단계로 구성하는 이유와, Glacier Deep Archive(12시간 초과), Intelligent-Tiering(패턴 알려진 경우 비적합), RDS 스냅샷(Glacier 직접 이전 불가)이 탈락하는 이유를 정리합니다.
📋 문제
회사에서 Amazon S3 버킷을 활용하여 데이터를 저장한다. 새로운 데이터 수명 주기 및 보존 정책은 다음과 같다.
① 새로 생성된 데이터: 온라인에서 사용 가능, SQL 분석 가능
② 3년 이후 데이터: 안전 보관 + 12시간 이내 복구 가능 (규정 준수 평가용)
③ 10년 이상 데이터: 안전하게 삭제
데이터 엔지니어는 이 정책에 따라 비용 효율적으로 저장할 수 있는 솔루션을 구성해야 한다.
📐 정답 — 3단계 S3 수명주기 아키텍처
Access (IA)
비주기적 분석
Flexible Retrieval
≤ 12시간 복구
규칙 실행
스토리지 비용 0
🧊 Glacier 스토리지 클래스별 검색 시간 — 12시간 요건이 핵심
Instant Retrieval
- 검색 시간: 밀리초(ms)
- 분기별 접근에 최적
- Flexible보다 비쌈
Flexible Retrieval ⭐
- 표준 검색: 3~5시간
- 대량 검색: 5~12시간
- 12시간 이내 충족
- Instant보다 저렴
Deep Archive
- 표준 검색: 최대 12시간
- 대량 검색: 최대 48시간
- 12시간 초과 가능성
- 가장 저렴하나 느림
📝 선택지 해설
각 항목을 클릭하면 해설이 펼쳐집니다.
정답: A — S3 IA + Athena + Glacier Flexible + 삭제 수명주기
이 문제의 핵심 구분 포인트는 두 가지입니다. ① 12시간 이내 복구: Glacier Flexible(3~12시간) ✅ vs Deep Archive(최대 48시간) ❌. ② 비용 효율: 가끔 SQL 분석 → Athena(서버리스) ✅ vs Redshift·RDS(상시 실행 비용) ❌.
📊 선택지 비교 요약
| 선택지 | 신규 데이터 저장 | SQL 분석 | 12시간 복구 | 비용 효율 | 결론 |
|---|---|---|---|---|---|
| A ⭐ | S3 IA | ✅ Athena | ✅ Glacier Flexible | ✅ 최적 | 정답 |
| B | Intelligent-Tiering | ✅ Athena | ❌ Deep Archive 초과 | ⚠️ 패턴 알려짐 | 탈락 |
| C | Redshift | ✅ Redshift SQL | ❌ Deep Archive 초과 | ❌ 상시 비용 | 탈락 |
| D | RDS | ✅ RDS SQL | Flexible 사용 | ❌ 상시 비용 + Glacier 이전 불가 | 탈락 |
'Stack > AWS' 카테고리의 다른 글
| [AWS DEA] Data Engineering Fundamentals (with AWS Toolkit) (0) | 2026.03.15 |
|---|---|
| [AWS DEA] 문제로 공부하기 19 - AppFlow (0) | 2026.03.15 |
| [AWS DEA] 문제로 공부하기 17 - Glue DPU 적정 용량 결정 (0) | 2026.03.15 |
| [AWS DEA] 문제로 공부하기 16 - Redshift SUPER 타입 + PartiQL (0) | 2026.03.15 |
| [AWS DEA] 문제로 공부하기 15 - IAM 서비스 역할(Role) (0) | 2026.03.15 |