중첩 JSON + 기존 테이블 무결성 유지 — Redshift SUPER 타입 + PartiQL이 정답인 이유
AWS DEA-C01 시험에 자주 나오는 Redshift 데이터 타입 문제입니다. 중첩 JSON 데이터를 기존 Redshift 테이블 구조를 변경하지 않고 쿼리하려면 SUPER 데이터 타입으로 로드 후 PartiQL로 쿼리하는 방법이 최적입니다. Redshift Spectrum(SQL 한계), Glue 평면화(스키마 변경), Glue Studio 노트북(고가용성 부재)이 탈락하는 이유를 비교 정리합니다.
📋 문제
한 ISP에서는 최근 고객 상호 작용 데이터를 중첩 JSON 형식으로 저장하기 시작했다. 회사는 이 데이터와 Amazon Redshift 데이터 웨어하우스의 추가 데이터를 결합하여 고객 상호 작용을 개선하려고 한다.
회사는 매일 여러 번 데이터에 대한 쿼리를 실행할 예정이다. 기존 Redshift 테이블의 무결성을 유지해야 하며, 솔루션은 가용성이 높아야 한다.
다음 중 이러한 요구 사항을 충족하는 솔루션은 무엇인가?
✅ 핵심 요구사항 분석
-
중첩 JSON + 기존 Redshift 데이터 결합 쿼리
두 데이터 소스를 함께 분석해야 하므로 Redshift 내에서 통합 가능해야 함 -
기존 Redshift 테이블 무결성 유지 (핵심 조건)
스키마 변경·열 추가·평면화 등 기존 테이블 구조를 수정하면 안 됨 -
매일 여러 번 쿼리 — 빈번한 접근
비용 효율적이고 빠른 쿼리 응답이 필요, 매번 변환 파이프라인 실행은 비효율 -
고가용성
단일 노트북·단일 Lambda처럼 이중화가 없는 솔루션은 부적합
🔑 핵심 개념 — Redshift SUPER 타입과 PartiQL
📋 중첩 JSON 데이터 예시 + PartiQL 쿼리
🔍 4가지 솔루션 요건 충족 비교
📝 선택지 해설
각 항목을 클릭하면 해설이 펼쳐집니다.
정답: B — SUPER 데이터 타입 + PartiQL
이 문제의 구분 포인트는 두 가지입니다. ① 중첩 JSON 쿼리 방법: 표준 SQL(A)은 변환 복잡, PartiQL(B)은 네이티브 탐색. ② 테이블 무결성: Glue 평면화(C)는 스키마 변경, SUPER 열 추가(B)는 기존 구조 보존.
📊 선택지 비교 요약
| 선택지 | 방식 | 중첩 JSON 쿼리 | 테이블 무결성 | 고가용성 | 결론 |
|---|---|---|---|---|---|
| A | Spectrum + SQL | ⚠️ 변환 복잡 | ✅ 유지 | ✅ Redshift HA | 탈락 |
| B ⭐ | SUPER + PartiQL | ✅ 네이티브 | ✅ 완벽 유지 | ✅ Redshift HA | 정답 |
| C | Glue 평면화 | 평면화 후 일반 열 | ❌ 스키마 변경 | ✅ Redshift HA | 탈락 |
| D | Glue Studio 노트북 | SQL 분리 분석 | 무관 | ❌ 노트북 이중화 없음 | 탈락 |
'Stack > AWS' 카테고리의 다른 글
| [AWS DEA] 문제로 공부하기 18 - S3-IA + Glacier Flexible Retrieval + 삭제 (0) | 2026.03.15 |
|---|---|
| [AWS DEA] 문제로 공부하기 17 - Glue DPU 적정 용량 결정 (0) | 2026.03.15 |
| [AWS DEA] 문제로 공부하기 15 - IAM 서비스 역할(Role) (0) | 2026.03.15 |
| [AWS DEA] 문제로 공부하기 14 - SQS 대기열 메시지 제거 (0) | 2026.03.14 |
| [AWS DEA] 문제로 공부하기 13 - Macie + EventBridge (0) | 2026.03.14 |