Maria Korolov
Contributing writer

AI 데이터센터, GPU 이어 스토리지 대란 온다···”HDD 물량 확보 시급”

기획
2025.10.236분
인공지능데이터센터엔터프라이즈 스토리지

AI 수요 급증으로 하드 디스크(HDD) 납기일이 최대 1년 이상으로 늘어날 전망이다. 기업용 플래시 스토리지(SSD) 역시 수요 폭등에 따라 가격 인상이 예상되고 있다.

shipping trucking container supply chain shutterstock 402767335
Credit: SasinTipchai / Shutterstock

GPU 공급난에 이어 저장 장치가 AI 데이터센터의 새로운 병목 요인으로 떠오르고 있다. 전문가들은 HDD 납기일이 1년 이상 증가하고 SSD 역시 공급 부족과 가격 상승을 겪을 것으로 전망했다. 이는 학습된 AI 모델이 실제 비즈니스에 투입되면서 추론(Inference) 수요가 급증한 결과다.

컨스텔레이션리서치(Constellation Research)의 애널리스트 치라그 메타는 “AI 추론은 GPU뿐만 아니라 데이터의 문제이기도 하다. 2026년까지 공급 부족이 계속되고 가격이 상승할 전망이다. 전력·공간·지연시간 제약이 큰 환경에서는 고밀도 플래시 스토리지로의 전환이 빨라질 것”이라고 말했다.

델오로그룹(Dell’Oro Group)은 HDD와 SSD를 포함한 스토리지 시장이 향후 5년간 연평균 20% 이상 성장할 것으로 내다봤다. 델오로그룹의 애널리스트 배런 펑은 “HDD와 SSD는 AI 인프라 스토리지의 각 계층에서 서로 다른 역할을 계속 수행할 것”이라고 설명했다.

트렌드포스(TrendForce)가 최근 발표한 보고서에 따르면 AI 추론 수요는 빠르게 늘고 있다. 이로 인해 모델이 외부 데이터베이스와 실시간으로 상호작용하는 빈도도 함께 증가하고 있다. HDD와 SSD 제조 업체는 모두 고용량 스토리지 제품 라인업을 강화하고 있는 것으로 나타났다.

예를 들어, HDD 제조 업체는 차세대 기술인 ‘열보조 자기 기록(Heat-Assisted Magnetic Recording, HAMR)’ 방식의 도입을 가속화하고 있다. 이는 레이저를 이용해 디스크 표면의 자기 입자를 가열한 뒤 데이터를 기록하는 방식으로, 기존보다 훨씬 더 높은 밀도로 데이터를 저장할 수 있다. 그러나 이 기술은 막대한 투자가 필요하고 생산 라인이 아직 완전히 안정화되지 않아, 결과적으로 기가바이트(GB)당 평균 가격이 상승하고 있다. HDD가 가진 가격 경쟁력이 줄어드는 반면 SSD 제조사들은 122테라바이트(TB) 이상 초고용량 제품을 출시하며 단가를 낮추고 전력 효율을 개선하고 있다.

이런 변화는 급증하고 있는 AI 추론 수요와 밀접한 관련이 있다.

AI 추론으로 인한 스토리지 수요

AI 추론은 AI 모델이 사용자 질문에 답변을 계산하고 내놓는 과정을 의미한다. 기업 환경에서는 벡터 데이터베이스나 외부 데이터 소스에 접근해 더 정확한 결과를 생성하는데, 이를 ‘검색 증강 생성(RAG, Retrieval-Augmented Generation)’이라고 부른다. AI 모델이 외부 업체의 클라우드 환경에서 작동하든, 기업 내부 온프레미스 환경에서 운영되든, 프롬프트가 길어질수록 추론 과정에서 필요한 스토리지 용량은 크게 늘어난다.

최근에는 추론에서 더 나아가, 논리적 단계를 거쳐 문제를 해결하는 ‘리즈닝(Reasoning) 모델’과 자율적으로 작업을 수행하는 에이전틱(Agentic) AI 시스템이 등장했다. 이는 데이터와 AI 모델 간의 상호작용 횟수를 급격히 늘리며 스토리지 시스템에 더 큰 부담을 가중시킬 전망이다.

또 다른 요인은, AI 모델과의 상호작용 비용이 지속적으로 낮아지고 있다는 점이다. 스탠퍼드 대학의 AI 인덱스 보고서에 따르면 AI 추론 비용은 작업 종류에 따라 연간 약 9분의 1에서 최대 900분의 1로 감소하고 있다. 에어스트리트캐피털(Air Street Capital)이 10월 발표한 AI 현황 보고서에서도 비슷한 흐름이 나타났다. 보고서에 의하면 구글의 AI 모델은 ‘비용 대비 지능’ 비율이 약 3.4개월마다 2배로 개선되고 있으며, 오픈AI는 약 5.8개월마다 2배로 향상되고 있다.

비용이 떨어지면 사용량은 자연스럽게 증가한다. 실제로 구글은 현재 월 1,300조 개의 토큰을 처리하고 있으며, 이는 1년 전 10조 개 수준에서 100배 이상 증가한 수치다. 오픈AI는 내역을 공개하지 않았지만, 매출이 크게 증가한 점을 고려할 때 처리량 역시 급증했을 가능성이 높다. 보도에 따르면 오픈AI의 2025년 상반기 매출은 43억 달러로 2024년 전체 매출인 37억 달러를 이미 넘어섰다.

트렌드포스는 내년 고용량 HDD 공급이 심각한 부족 사태를 겪을 것으로 전망하면서, 납기일이 몇 주 수준에서 1년 이상으로 급등할 것이라고 예측했다.

일반적으로 HDD는 단가가 낮아, 지연 시간에 민감하지 않은 데이터를 장기 보관하는 ‘콜드 스토리지’ 용도로 활용된다. 반면 성능이 더 뛰어난 SSD는 ‘웜, 핫 스토리지’에 적합하지만 가격이 높은 편이다. 하지만 트렌드포스는 HDD 공급난이 심화되면서 일부 데이터센터가 저비용 콜드 스토리지 영역까지 SSD로 대체하기 시작했다고 분석했다. 향후 SSD 가격이 하락하고 HDD 제약이 지속될 경우, 이러한 전환 흐름이 더욱 확대될 가능성도 있다.

트렌드포스 애널리스트 브라이언 아오는 “AI가 생성하는 데이터의 양이 HDD 생산 증가 속도를 훨씬 앞지르게 될 전망이다. 이에 대비해 SSD 스토리지를 확보해야 한다”라고 말했다.

그는 또한 2028년에 이르면 256TB를 저장할 수 있는 QLC SSD가 상용화될 것이라고 내다봤다. QLC(Quad-Level Cell)는 이전 세대 기술인 TLC(Triple-Level Cell)를 개선한 방식으로, 하나의 셀에 4비트를 저장할 수 있어 저장 밀도가 높다. 아오는 “이 같은 초대용량 QLC 솔루션은 총소유비용(TCO)과 성능 측면에서 HDD와 경쟁할 수 있는, 보다 효율적인 대안이 될 것”이라고 설명했다.

SK하이닉스의 자회사인 SSD 제조 기업 솔리다임(Solidigm)의 AI 및 리더십 마케팅 수석 디렉터 로저 코렐에 따르면, QLC는 네트워크 연결형 스토리지(NAS)에 최적화되어 페타바이트(PB)에서 엑사바이트(EB) 규모에 이르는 대규모 AI 파이프라인을 처리할 수 있다. 그는 “QLC는 공간과 전력 효율 면에서 매우 큰 절감 효과를 제공한다. AI 데이터센터 구축 시 한정된 전력과 공간을 최대한 효율적으로 활용하려면 QLC가 이상적인 선택지”라고 말했다.

트렌드포스 보고서는 스토리지 업체가 QLC SSD 생산을 늘리고 있지만 “2026년에는 기업용 SSD 공급이 다시 부족해질 것”이라고 예상했다. SSD 생산량만큼 AI 워크로드 또한 급격히 늘고 있기 때문이다. 코렐은 현재 “수요가 매우 강력하게 증가하고 있다”라고 밝혔다.

다만 코렐은 SSD가 HDD를 완전히 대체한다는 의미는 아니라고 전했다. 그는 “2026년 이후에는 SSD와 HDD가 공존하는 혼합 구성이 주류가 될 것”이라며 “HDD가 대용량 보관용으로 여전히 필요하겠지만, AI 워크로드에서는 성능과 효율 면에서 QLC 기반 SSD가 중심 스토리지로 자리 잡게 될 것”이라고 진단했다.

델오로그룹의 펑도 AI 배포에 여러 계층의 스토리지가 필요하다며, 각 계층마다 요구사항이 다르다고 설명했다. 특히 가공 전 단계의 데이터를 대규모로 저장하는 데는 HDD 기반의 콜드 스토리지가 적합하고, 전처리나 학습 이후의 추론 단계에는 SSD 기반의 웜 스토리지가 효율적이라는 설명이다. 그는 “각 스토리지의 역할이 명확히 구분돼 있다”라고 덧붙였다.

사전 계획이 필요한 때

컨스텔레이션의 메타는 데이터센터 관리자와 스토리지 구매 담당자들이 SSD 조달 계획을 GPU와 동일한 수준의 전략으로 관리해야 한다고 조언했다. 그는 “여러 공급처와 조기 공급 경로를 확보하고, 표준화된 구조를 적용해 벤더 교체가 데이터 저장 흐름에 영향을 주지 않도록 해야 한다”라고 말했다. 또한 QLC와 TLC 모두 최소 2개 이상의 벤더를 미리 검증하고 조달 계획을 앞당길 필요가 있다고 권고했다.

트렌드포스의 아오도 같은 의견을 내놨다. 그는 “지금부터 재고를 확보할 계획을 세워야 한다. 2026년에는 공급이 빠듯해져 벤더와의 장기 계약이 쉽지 않을 것”이라고 분석했다.

아오는 벤더의 현재 생산 여력을 고려할 때, 키옥시아(Kioxia), 샌디스크(SanDisk), 마이크론(Micron)이 128TB급 기업용 QLC SSD를 공급하기에 유리한 위치에 있다고 봤다. 그는 “장기적으로는 일부 모듈 제조사가 더 저렴한 비용으로 유사한 제품을 제공할 수도 있다. 피손(Phison)과 퓨어스토리지(Pure Storage) 같은 모듈 제조사가 대안을 적극적으로 개발하고 있다”라고 말했다.

또한 아오는 “이제 단순히 SSD는 빠른 저장 장치, HDD는 느린 저장 장치라고 구분하는 시대는 지났다. AI 시대에 스토리지는 더 복잡해지고 있다. 중소 규모 비즈니스 모델을 가진 기업이라면, AI 추론 수요에 대비해 Z낸드(Z-NAND)나 XL플래시(XL-Flash) 같은 신기술에도 주목할 필요가 있다”라고 말했다.

Z낸드, XL플래시는 SSD와 RAM(주기억장치) 사이에 위치한 중간 계층의 메모리 기술이다. 아오는 “고대역폭 메모리(HBM)나 고대역폭 플래시(HBF)에 비해 더 높은 비용 효율성을 제공한다”라고 설명했다.

한편 메타는 SSD가 표준화된 프로토콜을 사용한다는 장점이 있다고 언급했다. 그는 “이로 인해 인터페이스 종속과 같은 리스크가 적다. 실제 리스크는 프로토콜이 아니라 제품 로드맵과 공급 안정성에 있다”라고 말했다. 그는 기업이 가격 변동뿐 아니라 납기일과 전력 소비 변동성까지 고려해 장기 계획을 세워야 한다고 조언했다.

메타는 “미국 내 데이터센터의 전력 인프라가 한계에 다다랐다. 이제 스토리지의 TCO을 계산할 때 테라바이트(TB)당 전력 소비량이 중요한 기준으로 떠오르고 있다”라고 강조했다. 이어 그는 “2026년에는 가격, 납기일뿐만 아니라 전력도 병목 요인이 될 수 있다. 이런 요소를 모두 염두에 둬야 더 나은 스토리지 의사결정을 내릴 수 있다”라고 말했다.
[email protected]

Maria Korolov
Contributing writer

Maria Korolov is an award-winning technology journalist with over 20 years of experience covering enterprise technology, mostly for Foundry publications -- CIO, CSO, Network World, Computerworld, PCWorld, and others. She is a speaker, a sci-fi author and magazine editor, and the host of a YouTube channel. She ran a business news bureau in Asia for five years and reported for the Chicago Tribune, Reuters, UPI, the Associated Press and The Hollywood Reporter. In the 1990s, she was a war correspondent in the former Soviet Union and reported from a dozen war zones, including Chechnya and Afghanistan.

Maria won 2025 AZBEE awards for her coverage of Broadcom VMware and Quantum Computing.

이 저자의 추가 콘텐츠