본문 바로가기

Stack/AWS

[AWS DEA] 문제로 공부하기 17 - Glue DPU 적정 용량 결정

반응형
AWS DEA-C01 AWS Glue DPU 용량 결정 | 작업 실행 모니터링 완전 정리

AWS Glue DPU 적정 용량 결정 — 작업 실행 모니터링 섹션이 정답인 이유

AWS DEA-C01 시험에 자주 나오는 Glue 모니터링 문제입니다. DPU(데이터 처리 단위) 적정 용량을 결정하려면 AWS Glue 콘솔의 작업 실행 모니터링 섹션에서 이전 실행의 프로파일링 지표를 시각화해야 합니다. CloudWatch 지표·Logs Insights·시각화 ETL 섹션이 DPU 용량 결정에 부족한 이유를 함께 정리합니다.

📋 문제

회사가 AWS Glue를 사용하여 레코드를 처리하는 데이터 파이프라인을 배포했다. 레코드에는 JSON 이벤트와 base64 인코딩 이미지가 포함될 수 있다. 현재 Glue 작업은 10 DPU로 구성되었으나, 정기적으로 수백 DPU로 확장되고 실행 시간이 오래 걸린다.

데이터 엔지니어는 데이터 파이프라인을 모니터링하여 적절한 DPU 용량을 결정해야 한다.

다음 중 이러한 요구 사항을 충족하는 솔루션은 무엇인가?

✅ 핵심 요구사항 분석

  • 📊
    이전 실행 데이터 기반으로 적정 DPU 결정
    현재 10 DPU → 수백 DPU로 자동 확장되는 원인 파악 후 최적값 설정 필요
  • 🔍
    DPU 사용률 프로파일링 지표 시각화
    단순 로그·메트릭이 아닌 DPU 사용 패턴을 시각적으로 분석할 수 있는 도구 필요

💡 DPU(Data Processing Unit)란?

AWS Glue 작업의 컴퓨팅 용량 단위입니다. 1 DPU = 4 vCPU + 16GB 메모리. 작업 복잡도와 데이터 볼륨에 따라 자동 스케일링되며, 너무 낮으면 처리 지연, 너무 높으면 불필요한 비용이 발생합니다. 이전 실행의 실제 DPU 사용 패턴을 분석하는 것이 적정값 결정의 핵심입니다.

🖥️ AWS Glue 콘솔 — 작업 실행 모니터링 섹션

Glue 콘솔 → Monitoring(모니터링)Job run monitoring(작업 실행 모니터링)에서 이전 실행의 DPU 프로파일 지표를 시각화할 수 있습니다.

📊 작업 실행 모니터링 — DPU 프로파일 지표
실행 1 (어제 02:00)
12 DPU
12 DPU
실행 2 (어제 08:00)
240 DPU
240 DPU
실행 3 (어제 14:00)
420 DPU
420 DPU
실행 4 (오늘 02:00)
10 DPU
10 DPU
최대 DPU 추천
시각화로 최적값 결정
→ 결정
핵심: Glue 작업 실행 모니터링 섹션은 이전 실행 결과의 DPU 사용량·실행 시간·메모리 사용률 등 프로파일링 지표를 시각화합니다. 이 정보를 바탕으로 최소/최대 DPU를 적절히 설정할 수 있습니다.

🔍 4가지 솔루션 비교

📊
A. Glue 작업 실행 모니터링 ⭐
DPU 지표 ✅ 직접 제공
이전 실행 ✅ 히스토리 조회
시각화 ✅ 프로파일 그래프
DPU 결정 ✅ 직접 가능
✅ DPU 용량 결정에 최적
🎨
B. Glue 시각화 ETL 섹션
목적 작업 생성·편집
DPU 지표 ❌ 없음
이전 실행 ❌ 없음
DPU 결정 ❌ 불가
❌ 작업 편집 도구 — DPU 분석 불가
📈
C. CloudWatch 지표
Glue 지표 ✅ 조회 가능
과거 데이터 ✅ 접근 가능
전체 작업 상세 ⚠️ 제한적
DPU 프로파일 ❌ 불충분
⚠️ 일반 지표만 — DPU 결정에 불충분
🔎
D. CloudWatch Logs Insights
Spark 로그 ✅ 분석 가능
DPU 정보 ❌ 로그에 없음
DPU 쿼리 ❌ 불가
DPU 결정 ❌ 불가
❌ DPU 정보가 로그에 수집되지 않음
⚠️ C vs A 핵심 차이: CloudWatch 지표(C)는 Glue의 일반 성능 지표(메모리, CPU 등)를 제공하지만, DPU 용량 결정에 필요한 작업별 상세 프로파일링 정보는 Glue 자체 모니터링 섹션(A)이 더 적합합니다. Glue 콘솔은 실행 이력과 DPU 프로파일을 통합된 뷰로 제공합니다.

📝 선택지 해설

각 항목을 클릭하면 해설이 펼쳐집니다.

💡 정답. AWS Glue 콘솔의 작업 실행 모니터링(Job run monitoring) 섹션은 이전 작업 실행의 DPU 사용량, 실행 시간, 메모리 사용률 등의 프로파일링 지표를 시각화합니다. 이 정보를 통해 어떤 실행에서 DPU가 급격히 증가했는지, 평균 DPU 사용량이 어느 정도인지를 파악하여 최소/최대 DPU 설정값을 데이터 기반으로 결정할 수 있습니다. 10 DPU로 시작했지만 수백 DPU로 확장되는 패턴을 분석하여 불필요한 오버-스케일링을 방지하고 비용을 최적화할 수 있습니다.
💡 AWS Glue 콘솔의 시각화 ETL(Visual ETL) 섹션은 드래그 앤 드롭으로 Glue 작업을 생성하고 편집하는 작업 설계 도구입니다. 소스·변환·대상 노드를 시각적으로 연결하여 ETL 파이프라인을 구성하는 것이 목적입니다. 이전 실행의 DPU 사용량이나 성능 프로파일링 정보는 전혀 제공하지 않습니다. DPU 용량 결정과는 완전히 다른 목적의 섹션입니다.
💡 Amazon CloudWatch 지표 섹션에서 AWS Glue 네임스페이스를 필터링하면 Glue 작업의 메모리·CPU 등 성능 지표를 확인할 수 있습니다. 그러나 "전체 작업 세부 정보"를 검사하는 것만으로는 DPU 적정 용량을 결정하기 어렵습니다. DPU 용량 결정을 위해서는 단순 지표가 아니라 실행별 DPU 프로파일 및 활용 패턴의 통합된 뷰가 필요한데, 이는 Glue 자체 모니터링 섹션(A)에서 더 효과적으로 제공됩니다.
💡 CloudWatch Logs Insights는 Glue 작업의 드라이버 로그·실행자 로그·Apache Spark 작업 진행 표시줄 등을 분석하는 데 유용합니다. 그러나 AWS Glue 작업 로그에는 DPU 사용량에 관한 정보가 수집되지 않습니다. 'DPU' 키워드로 로그를 쿼리해도 DPU 정보를 찾을 수 없으므로 DPU 용량 결정에 필요한 데이터를 얻을 수 없습니다.

정답: A — Glue 콘솔 작업 실행 모니터링 섹션

DPU 용량 결정 = Glue 콘솔 Job Run Monitoring이 핵심입니다. CloudWatch 지표(C)는 일반 성능 모니터링, Logs Insights(D)는 Spark 로그 분석 목적이며, 시각화 ETL(B)은 작업 설계 도구입니다. DPU 프로파일링과 이력 시각화는 Glue 자체 모니터링 섹션에서만 통합 제공됩니다.

# AWS Glue DPU 용량 결정 워크플로 1. Glue 콘솔 → Monitoring → Job run monitoring 2. 대상 작업의 이전 실행 목록 조회 3. 각 실행의 DPU 프로파일 지표 시각화 - 최대 DPU 사용량 - 평균 DPU 사용량 - DPU 확장 패턴 (10 → 수백 DPU) - 실행 소요 시간 4. 피크 DPU 기반으로 최적 Max DPU 값 설정 # 각 모니터링 도구 목적 구분 Glue Job Run Monitoring → DPU 프로파일 시각화 ⭐ CloudWatch 지표 → 일반 Glue 성능 지표 (메모리, CPU 등) CloudWatch Logs Insights → Spark 드라이버/실행자 로그 분석 Glue 시각화 ETL → 작업 파이프라인 생성·편집

📊 선택지 비교 요약

선택지 도구 목적 DPU 이력 조회 DPU 결정 가능 결론
A ⭐ Glue 작업 실행 모니터링 실행 이력 + DPU 프로파일 ✅ 직접 제공 ✅ 가능 정답
B Glue 시각화 ETL 작업 생성·편집 ❌ 없음 ❌ 불가 탈락
C CloudWatch 지표 일반 성능 지표 ⚠️ 제한적 ⚠️ 불충분 탈락
D CloudWatch Logs Insights Spark 로그 분석 ❌ 로그에 없음 ❌ 불가 탈락
#AWS_DEA-C01 #AWSGlue #DPU #데이터처리단위 #Glue작업실행모니터링 #CloudWatch #CloudWatchLogsInsights #Glue시각화ETL #ETL파이프라인 #Glue성능최적화 #AWS자격증 #AWS데이터엔지니어
반응형