Peter Sayer
Executive Editor, News

퍼플렉서티·캔바·줌까지…AWS 다이나모DB 장애 확산, 3시간 만에 복구

뉴스
2025.10.213분
아마존 웹 서비스DNSIaaS

미국 동부 리전에서 AWS의 관리형 데이터베이스 서비스 다이나모DB(DynamoDB) 오류율이 태평양표준시 기준 자정 직후 급격히 치솟으며, 다른 AWS 서비스로 확산돼 다수의 고객에게 영향을 미쳤다.

Large AWS sign. Amazon Web Services (AWS) is a subsidiary of Amazon that provides on-demand cloud computing platforms - Las Vegas, Nevada, USA - December 3, 2019
Credit: Michael Vi / Shutterstock

아마존웹서비스(AWS)의 미국 동부(US-EAST-1) 리전을 사용하는 이용자들에게 20일 월요일은 좋지 않은 출발이었다. DNS 문제로 다이나모DB API가 불안정해지면서, 다수의 AWS 서비스와 고객이 영향을 받았기 때문이다.

이번 사고의 근본 원인은 여러 AWS 클라우드 리전 중 하나에서 단일 API에 국한된 것으로 보이지만, 해당 API는 아마존 자체 서비스는 물론 고객사 서비스의 기반이 되는 핵심 데이터베이스 역할을 하고 있어 피해 범위가 다른 리전으로까지 확산됐다.

AI 검색 기업 퍼플렉서티는 이번 사고의 영향을 받은 업체 중 하나로, “AWS 운영 문제로 인한 서비스 중단을 겪고 있다”라고 밝혔다. 온라인 디자인 툴 캔바 역시 AWS를 직접 언급하지는 않았지만, 같은 시각 “기반 클라우드 서비스의 장애로 인해 사용자 오류율이 증가했다”고 밝혔다.

실시간 장애 감시 서비스 다운디텍터(Downdetector)는 벤모(Venmo), 로쿠(Roku), 리프트(Lyft), 줌(Zoom), 맥도날드 앱(McDonald’s App) 등에서도 접속 장애가 보고되고 있으며, “AWS 문제와 관련됐을 가능성이 있다”라고 전했다.

오류율 증가

AWS는 태평양표준시 기준 오전 12시 11분, 자체적인 서비스 상태 페이지를 통해 처음으로 이번 사고를 보고했다. AWS는 당시 “US-EAST-1 리전의 여러 서비스에서 오류율과 지연 시간이 증가하고 있어 조사를 진행 중”이라고 밝혔다.

이후 한 시간 남짓 지나 AWS는 문제의 원인을 다이나모DB 엔드포인트로 좁혔으며, 해당 장애가 다른 서비스에도 영향을 미치고 있다고 설명했다. 약 30분 뒤에는 “조사 결과, US-EAST-1 리전 다이나모DB API 엔드포인트의 DNS 해석 문제로 보인다”라며 “복구 속도를 높이기 위해 여러 경로로 병행 대응 중”이라고 전했다.

이 시점에서 문제는 미국 동부 지역의 사용자나 서비스에만 국한된 것이 아니라는 점이 명확해졌다. AWS는 “IAM 업데이트나 다이나모DB 글로벌 테이블처럼 US-EAST-1 엔드포인트에 의존하는 글로벌 서비스와 기능도 영향을 받을 수 있다”라고 밝혔다.

태평양표준시 오전 2시 27분, 즉 사고 조사 시작 후 약 두 시간이 조금 넘은 시점에 AWS는 “초기 완화 조치를 적용했으며, 실패한 요청은 재시도하라”고 고객사에 권고했다. 다만 일부 서비스는 처리 대기 중인 작업으로 인해 추가 지연이 발생할 수 있다고 경고했다.

조사 시작 약 세 시간 후 AWS는 “US-EAST-1 리전에 의존하는 글로벌 서비스와 기능이 복구됐다”고 발표했으며, “추가 정보가 확인되는 대로 업데이트를 제공하겠다”라고 밝혔다.

클라우드의 의존성

이번 장애는 비교적 빠르게 복구됐지만, 클라우드 환경에서도 전 세계에 영향을 미칠 수 있는 ‘단일 장애 지점(single point of failure)’이 존재한다는 사실을 다시 한번 보여줬다.

몇 달 전에는 마이크로소프트(MS)가 같은 상황을 겪었다. MS 애저 미국 동부 리전에서 발생한 문제가 다른 조직으로 확산되면서 큰 혼란을 초래했다. 그 이전에는 IBM 클라우드에서 연이어 발생한 장애로 인해 고객들이 자신들의 설계 선택이 옳았는지 의문을 제기하기도 했다. 당시 세 번째로 발생한 짧은 장애는 IBM 클라우드의 54개 서비스에 영향을 미쳤다.
[email protected]