TD COWEN )데이터 센터 채널 점검: MSFT 철수로 GOOG 및 META에 기회 창출
NVIDIA GTC 및 DCD Connect에서의 채널 점검 결과, MSFT의 임대 취소/연기와 같은 보다 광범위한 취소에도 불구하고 전반적인 데이터 센터 수요는 전년 대비 증가한 것으로 나타났습니다. 이는 GOOG 및 META가 용량을 백필(채워 넣는)하면서 수요가 증가했기 때문입니다. 고밀도화를 위한 하이퍼스케일 재설계가 데이터 센터 장비 구매를 느리게 만들고 있으며, 이는 1H25 VRT(Vertiv) 주문에 부정적으로 작용할 것으로 보고 있습니다.
하이퍼스케일 수요는 전년 대비 증가함; MSFT 임대 취소가 GOOG 및 META에 기회를 창출
지난주 San Jose에서 열린 NVIDIA GTC 및 이번 주 뉴욕에서 열린 DCD Connect에서 얻은 명확한 결론은, 동일한 요인들(우리가 2월 말에 강조한 바 있음)에 의해 하이퍼스케일 데이터 센터 수요가 전년 대비 증가했다는 것입니다. MSFT와 관련해서는, 우리가 MSFT의 임대 취소에 대한 초기 노트를 발표한 이후, 임대 취소로 영향을 받은 제3자 데이터 센터 운영자 리스트가 확장되었으며, 미국과 유럽 양 지역 모두에서 임대가 종료되거나 취소된 것으로 보입니다. 우리의 채널 점검은 MSFT의 임대 연기도 나타내고 있습니다. PTC 컨퍼런스에서의 인사이트를 기준으로 보면, MSFT는 최근 6개월간 (1) 미국과 유럽에서 임대 예정이던 +2GW 규모의 용량을 철회했고, (2) 기존에 임대되었던 데이터 센터 계약들도 취소 및 연기했습니다.
이번 신규 용량 철수의 배경은 OpenAI 훈련 워크로드에 대한 새로운 투자를 하지 않겠다는 결정에 따른 것으로 보입니다. 우리는 MSFT가 데이터 센터 용량 과잉 상태에 있으며, 이러한 철수가 단기 수요 예측에 부합하지 않기 때문이라고 봅니다. 따라서, 이번 철수는 MSFT가 주요 시장에서 중기적 인프라 용량을 확보해 AI/클라우드 워크로드를 지원하려는 의도로 보이며, 필요 용량이 중기 수요를 초과하는 것으로 보입니다. (자세한 내용은 오프닝 링크 참고)
제3자 데이터 센터 운영자들에게 긍정적인 점은, MSFT가 철회한 용량을 대신해 GOOG가 이를 백필하고 있다는 것입니다. 이는 특히 미국 외 지역에서의 국제 시장에서 두드러지며, META 또한 미국 내에서 백필 수요를 만들어내고 있습니다. 두 업체 모두 전반적인 데이터 센터 수요 증가세 한가운데 있기 때문입니다. 수요 급증의 배경은 내부 수요 재조정과 함께 글로벌 AI 훈련 급증 때문입니다. META의 경우, Llama를 지원하기 위한 데이터 센터 용량 증가가 원인입니다.
또한, 우리의 채널 점검에 따르면 OpenAI 역시 제3자 업체들(예: GPU를 서비스하는 CSP 및 제3자 데이터 센터 운영자)로부터 직접 용량을 조달하려는 움직임을 보이고 있으며, CoreWeave와의 최근 발표된 계약이 그 사례입니다. 우리는 OpenAI가 자체 데이터 센터를 건설할 가능성 또한 염두에 두고 있습니다. 특히 각 스타게이트(StarGate) 프로젝트는 약 800MW~1.5GW의 용량을 나타내며, 총 6GW 이상의 장기 용량을 계획 중입니다. 우리의 점검 결과, OpenAI가 다른 하이퍼스케일러로부터 인력을 빼오는 것, 설계 및 시공 경험 인수, 그리고 자체 건설로의 방향 전환은 중장기적으로 OpenAI가 자체 데이터 센터 건설을 시작할 수 있다는 가능성을 시사합니다.
우리는 고밀도화를 위한 하이퍼스케일 재설계로 인한 데이터 센터 장비 주문 둔화를 확인하고 있으며, 이는 1H25 Vertiv 주문 물량에 부정적이라고 평가함
우리의 채널 점검에 따르면, 데이터 센터 장비 주문 둔화가 나타나고 있습니다. 이는 하이퍼스케일 업체들이 기존 데이터 센터를 고밀도화하기 위한 재설계에 들어가면서 시작된 1월 이후의 추세에 따른 것입니다. 우리는 이를 1H25 기간 중 Vertiv 주문에 부정적으로 작용할 것으로 보고 있습니다.
고밀도 랙 지원: Nvidia가 로드맵을 지속적으로 발전시키며 랙 밀도를 높이고 있습니다. 예를 들어, 우리의 점검 결과 Microsoft가 액체-액체 냉각 솔루션(아래에서 언급한 공기-보조 액체 냉각과는 별도의 것)을 마무리하고 있는 것으로 나타났으며, 다른 하이퍼스케일러들(Google 포함)도 유사한 재설계를 진행 중인 것으로 확인됩니다. 그러나 이러한 재설계의 파급효과는 하이퍼스케일러와 제3자 데이터 센터 운영자 모두가 새 디자인이 확정되기 전까지 필요한 장비의 구체적인 유형이 결정되지 않기 때문에 장비 주문을 거의 할 수 없다는 것입니다.
이에 따라 공급망 점검에서는 리스된 하이퍼스케일 용량에 대한 데이터 센터 장비 구매 결정이 1~2분기 연기되는 것으로 나타났습니다. 또한 제3자 데이터 센터 운영자들이 상당한 장비 재고를 쌓아두고 시장 출시 속도를 높이려는 움직임과 결합되면서, 우리는 이 현상이 1H25 기간 중 Vertiv 장비 주문에 부정적인 영향을 미칠 것으로 보고 있습니다.
추론으로 가는 길이 시작됐다; 우리는 이 길이 하이퍼스케일 데이터 센터 개조에서 시작된다고 본다
우리는 1월에 Microsoft가 일부 데이터 센터 운영자에게 2024년 10월부터 액체 냉각을 지원하기 위해 기존 데이터 센터를 개조할 계획임을 통보한 사실을 강조한 바 있습니다. 이후 Metro Connect 컨퍼런스에서의 인사이트에서도, Amazon이 유사한 개조 계획을 진행하고 있다는 점을 언급했는데, 이는 주요 시장에서의 전력 수확과 워크로드 유연성 확보 요구와 관련된 것으로 보입니다.
최근 점검을 통해, 우리는 Microsoft가 기존 구식 데이터 센터에서의 고밀도 랙 지원을 위해 ‘사이드카’ 형태의 공기-보조 액체 냉각 솔루션을 내부적으로 배포하려는 계획을 가지고 있음을 확인했습니다. 흥미롭게도, Azure Infrastructure Blog에서도 10월경 비슷한 시점에 액체-대-액체 히트 익스체인저(열 교환기)를 사용해 기존 레거시 데이터 센터를 직접-투-칩(DTC) 액체 냉각을 지원할 수 있도록 개조하려는 내용을 공개한 바 있습니다.
우리는 공기-보조 액체 냉각이 기존 구식 데이터 센터에서 고밀도 랙 설치를 위한 ‘스팟 냉각’ 솔루션으로 더 비용 효율적인 접근 방식이라고 보고 있습니다. 이는 기존 센터 전체를 재설계하거나 개조할 필요 없이 단일 랙만을 대상으로 할 수 있기 때문입니다.
중요하게도, 우리의 점검에 따르면 이러한 개조의 주요 동기는 추론 용량을 빠르게 확보하려는 수요입니다. 고밀도 액체 냉각을 활용하는 주요 시장에서, 하이퍼스케일러들은 이미 새로운 추론 용량을 확보하고 있으며 이는 기존의 가용 영역 안에서도 사용할 수 있는 것으로 나타났습니다.
결론적으로, 우리는 추론이 시작 단계에 있으며, 적어도 일부 하이퍼스케일러들이 이를 위해 인프라 개조에 나서고 있다고 보고 있습니다. 이로 인해, 하이퍼스케일러의 추론 속도는 제3자 임대 시장의 신규 마켓 진입 속도보다 더 빠를 수 있으며, 이는 특히 자회사/모회사 아키텍처 기반으로 기존 가용 영역 내에서 배치될 경우 더욱 그러할 수 있습니다.