본문 바로가기

Stack/AWS

[AWS DEA] 문제로 공부하기 19 - AppFlow

반응형
AWS DEA-C01 SaaS → Redshift 데이터 전송 | Amazon AppFlow 완전 정리

SaaS → Redshift 지속 데이터 전송 — Amazon AppFlow가 정답인 이유

AWS DEA-C01 시험에 자주 나오는 SaaS 데이터 통합 문제입니다. SaaS 애플리케이션 데이터를 Amazon Redshift로 코드 없이 지속적으로 전송하는 솔루션으로 Amazon AppFlow 플로가 정답인 이유를 EventBridge(중개 서비스 필요), Lambda UDF(지속 전송 불가), MWAA(추가 관리 필요)와 비교하여 도식으로 정리합니다.

📋 문제

회사가 Amazon Redshift 데이터 웨어하우스를 운영하며, 최근 여러 AWS 서비스를 지원하는 SaaS 영업 애플리케이션 사용을 시작했다. 보고 목적으로 SaaS 애플리케이션의 일부 데이터를 Amazon Redshift로 전송하고자 한다.

데이터 엔지니어는 SaaS 애플리케이션에서 Amazon Redshift로 데이터를 지속적으로 전송할 수 있는 솔루션을 구성해야 한다. 요구 사항: 최소한의 운영 오버헤드

다음 중 이러한 요구 사항을 충족하는 솔루션은 무엇인가?

🔌 Amazon AppFlow — SaaS 데이터 통합 전용 완전관리형 서비스

💡 Amazon AppFlow는 코드 없이 SaaS 애플리케이션과 AWS 서비스 간에 데이터를 안전하게 전송하는 완전관리형 통합 서비스입니다. 플로(Flow)를 생성하여 소스 → 대상 데이터 이동을 자동화합니다.

✅ AppFlow 플로 — SaaS → Redshift 지속 전송 흐름

SaaS 영업 앱
(Salesforce 등)
Amazon AppFlow
플로(Flow)
Amazon Redshift
(보고용 DW)
이벤트 기반 실행 — 데이터 생성 시 자동 트리거
코드 없음 · 서버 없음 · 자동 스케일링

🔌 AppFlow 지원 SaaS 소스 (주요 예시)

Salesforce HubSpot ServiceNow Slack Zendesk SAP Marketo Google Analytics Shopify + 60개 이상
대상(Target)으로 Amazon Redshift 직접 지원 — 중간 변환·코드·인프라 없이 SaaS 소스에서 Redshift로 직접 전송합니다. 이벤트 트리거, 예약 실행, On-demand 실행 모두 지원합니다.

🔍 4가지 솔루션 비교

🔌
A. Amazon AppFlow ⭐
SaaS 연결 ✅ 60+ 네이티브
Redshift 직접 ✅ 대상 지원
이벤트 트리거 ✅ 지원
코드 필요 ✅ 불필요
오버헤드 ✅ 최소
✅ 모든 요건 충족 — 정답
B. EventBridge 규칙
이벤트 감지 ✅ 가능
Redshift 직접 ❌ 불가
중개 서비스 ❌ 별도 필요
오버헤드 ❌ 추가 구성
❌ Redshift 직접 전송 불가
λ
C. Lambda UDF
목적 SQL 내 커스텀 함수
지속 전송 ❌ 불가
SaaS → Redshift ❌ 목적 다름
오버헤드 ❌ 높음
❌ 데이터 전송 목적 아님
🌬️
D. Amazon MWAA
파이프라인 ✅ 구성 가능
JDBC 연결 ✅ Redshift 가능
추가 관리 ❌ 높은 오버헤드
오버헤드 ❌ 클러스터 관리
⚠️ 가능하나 오버헤드 높음
⚠️ B 핵심 함정: EventBridge는 SaaS 이벤트를 감지할 수 있지만 Amazon Redshift를 직접 대상(Target)으로 지정할 수 없습니다. Lambda나 Kinesis 같은 중개 서비스를 추가로 구성해야 하므로 운영 오버헤드가 증가합니다.

📝 선택지 해설

각 항목을 클릭하면 해설이 펼쳐집니다.

💡 정답. Amazon AppFlow는 이 시나리오의 모든 요건을 가장 적은 오버헤드로 충족합니다. ① SaaS 네이티브 연결: Salesforce, ServiceNow 등 60개 이상의 SaaS 커넥터를 코드 없이 연결합니다. ② Redshift 직접 전송: Amazon Redshift를 대상으로 직접 지정할 수 있어 중간 단계가 필요 없습니다. ③ 이벤트 기반 실행: 데이터 생성 이벤트에 반응하여 플로가 자동 실행되므로 지속적인 전송이 가능합니다. ④ 완전관리형: 인프라, 스케일링, 오류 처리를 AWS가 모두 관리합니다.
💡 Amazon EventBridge는 이벤트 기반 아키텍처의 중심 서비스이지만, Amazon Redshift를 EventBridge 규칙의 직접 대상(Target)으로 지정할 수 없습니다. EventBridge의 지원 대상은 Lambda, SQS, SNS, Step Functions, Kinesis 등이며, Redshift에 데이터를 쓰려면 Lambda 함수 등 중간 서비스를 통해야 합니다. 이 추가 구성이 운영 오버헤드를 증가시키므로 "최소 운영 오버헤드" 요건에 맞지 않습니다.
💡 Redshift Lambda UDF(사용자 정의 함수)는 Redshift SQL 쿼리 실행 중 복잡한 변환이나 외부 API 호출을 위해 사용하는 기능입니다. 이것은 Redshift 내부에서 쿼리 처리 중 호출되는 것으로, SaaS 애플리케이션에서 데이터를 지속적으로 수집하는 파이프라인 목적이 아닙니다. Lambda UDF는 관리형 환경에서 실행되며 외부 시스템 접근이 제한되므로 이 시나리오의 요건을 충족하지 못합니다.
💡 Amazon MWAA(Managed Workflows for Apache Airflow)는 복잡한 데이터 파이프라인 오케스트레이션에 강력한 서비스입니다. JDBC 커넥터를 통해 Redshift와 연결하는 것도 기술적으로 가능합니다. 그러나 이 솔루션을 사용하려면 Airflow 환경 설정, DAG 작성, MWAA 환경 관리, 스케일링 구성 등 상당한 운영 오버헤드가 필요합니다. 단순히 SaaS → Redshift 데이터 전송을 위해 MWAA를 사용하는 것은 과도한 구성이며, AppFlow처럼 전용 커넥터가 있는 서비스에 비해 효율적이지 않습니다.

정답: A — Amazon AppFlow

"SaaS → AWS 서비스 데이터 전송 + 최소 오버헤드" 조합이 나오면 AppFlow를 떠올리세요. EventBridge는 Redshift 직접 대상 불가, Lambda UDF는 목적 다름, MWAA는 오버헤드 과다.

# Amazon AppFlow 핵심 특징 목적: SaaS ↔ AWS 서비스 간 데이터 전송 자동화 코드: 불필요 (No-code/Low-code) 관리: 완전관리형 (서버리스) 지원 소스 (SaaS): Salesforce, ServiceNow, Slack, Zendesk, SAP, HubSpot, Marketo 등 60+ 지원 대상 (AWS): Amazon Redshift ⭐, S3, RDS 등 실행 트리거: - 이벤트 기반 (On-event) - 예약 실행 (Scheduled) - On-demand # 서비스 목적 비교 AppFlow → SaaS ↔ AWS 데이터 전송 전용 ⭐ EventBridge → 이벤트 라우팅 (Redshift 직접 불가) Lambda UDF → Redshift SQL 내 커스텀 로직 MWAA (Airflow) → 복잡한 파이프라인 오케스트레이션

📊 선택지 비교 요약

선택지 서비스 Redshift 직접 전송 지속 전송 운영 오버헤드 결론
A ⭐ Amazon AppFlow ✅ 네이티브 대상 ✅ 이벤트 트리거 최소 정답
B EventBridge ❌ 중개 필요 이벤트 감지만 추가 구성 탈락
C Lambda UDF ❌ 목적 다름 ❌ 지속 불가 높음 탈락
D Amazon MWAA JDBC 통해 가능 ✅ DAG로 가능 높음 (Airflow 관리) 탈락
#AWS_DEA-C01 #AmazonAppFlow #SaaS데이터통합 #AmazonRedshift #AmazonEventBridge #LambdaUDF #AmazonMWAA #AppFlow플로 #최소운영오버헤드 #데이터전송자동화 #AWS자격증 #AWS데이터엔지니어
반응형