AMD, 아리스타, ARM, 브로드컴, 시스코, HPE 네트워킹, 마벨, 메타, 마이크로소프트, 엔비디아가 모여 이더넷 고도화를 위한 연합을 결성했다.

AI 네트워킹 기술이 주목받는 가운데, 이더넷이 증가하는 트래픽 부하를 처리할 수 있도록 하려는 새로운 협의체가 출범했다.
AMD, 아리스타, ARM, 브로드컴, 시스코, HPE 네트워킹, 마벨, 메타, 마이크로소프트, 엔비디아, 오픈AI, 오라클은 ESUN(Ethernet for Scale-Up Networking)’ 이니셔티브에 참여했다. ESUN은 가속화된 AI 인프라 전반에서 확장된 연결성을 지원할 수 있도록 이더넷 기술을 발전시키는 것을 목표로 한다. 이번 협의체는 오픈 컴퓨트 프로젝트(Open Compute Project, OCP)가 주도한다.
시스코의 공통 하드웨어 그룹 총괄 부사장 마틴 런드는 블로그를 통해 “AI 워크로드가 현대 데이터센터 아키텍처를 재편하고 있으며, 네트워킹 솔루션 또한 이런 수요에 대응할 수 있도록 진화해야 한다”라고 밝혔다. 런드는 “ESUN은 AI 인프라 운영자와 솔루션 업체가 함께 개방형 표준을 정립하고 베스트 프랙티스를 공유하며, 확장형 네트워킹을 위한 이더넷 혁신을 가속화하기 위한 협의체”라고 설명했다.
ESUN은 개방형 표준 기반의 이더넷 스위칭과 프레이밍에만 초점을 맞춘다. 호스트 측 스택, 비 이더넷 프로토콜, 애플리케이션 계층 솔루션, 독점 기술은 배제한다. OCP는 “ESUN은 확장형 네트워크를 위한 XPU 네트워크 인터페이스와 이더넷 스위치 ASIC의 개발 및 상호운용성을 강화할 것”이라며, “초기 단계에서는 L2/L3 이더넷 프레이밍과 스위칭에 집중해 안정적이고 손실 없는 오류 복원형 단일 홉 및 다중 홉 토폴로지를 구현할 계획”이라고 밝혔다.
ESUN, UEC, UALink의 관계
OCP는 특히 ESUN이 AI 네트워크용 이더넷 발전을 목표로 하는 다른 단체들과도 긴밀히 협력할 예정이라고 밝혔다. 여기에는 울트라 이더넷 컨소시엄(Ultra Ethernet Consortium, UEC)과 IEEE 802.3 이더넷 위원회가 포함된다. OCP는 “ESUN은 이들 단체와 협력해 개방형 표준을 정립하고 베스트 프랙티스를 반영하며, 혁신을 가속화할 것”이라고 전했다.
AMD, 아리스타, 브로드컴, 시스코, 에비덴, HPE, 인텔, 메타, 마이크로소프트는 2023년 UEC를 결성했으며, 현재 회원사는 75곳이 넘는다. UEC의 목표는 고성능 네트워킹을 위한 완전한 이더넷 기반 통신 스택 아키텍처를 업계 공동으로 구축하는 것이다.
또 다른 협력체인 울트라 액셀러레이터 링크(Ultra Accelerator Link, UALink) 컨소시엄은 최근 AI 클러스터 간 개방형 표준 인터커넥트를 제공하기 위한 첫 사양을 발표했다. ‘UALink 200G 1.0 사양’은 AMD, 브로드컴, 시스코, 구글, HPE, 인텔, 메타, 마이크로소프트, 시놉시스 등 약 75개 회원사가 공동으로 개발했다. 가속기와 스위치 간 채널 또는 레인당 최대 초당 200기가 전송(200GT/s)을 지원하고, 최대 1,024개의 AI 컴퓨팅 팟 간 통신을 가능하게 하는 기술 요건을 제시하고 있다.
아리스타의 CEO 제이슈리 울랄과 최고 개발 책임자 휴 홀브룩은 ESUN 관련 블로그에서 “ESUN은 가능한 한 IEEE와 UEC가 개발한 이더넷 표준을 적극 활용할 것”이라고 밝혔다. 두 사람은 또한 이더넷 기반 확장형 네트워킹을 위한 3단계 모듈형 프레임워크를 제시했다.
- 상호운용성을 위한 공통 이더넷 헤더(Common Ethernet headers). ESUN은 이더넷 위에 상위 계층 프로토콜과 다양한 활용 사례를 지원할 수 있는 구조를 구축한다.
- 개방형 이더넷 데이터링크 계층(Open Ethernet data link layer). XPU 클러스터 규모에서도 고성능 AI 연산을 가능하게 하는 기반을 제공한다. 표준 기반 메커니즘(LLR, PFC, CBFC)을 채택함으로써 비용 효율성과 유연성을 확보하면서도 성능을 유지할 수 있다. 수천 개의 동시 연산에서는 미세한 지연만으로도 전체 연산이 정체될 수 있기 때문이다.
- 이더넷 물리 계층(Ethernet PHY layer). 범용적으로 사용되는 이더넷 물리 계층을 기반으로, 솔루션 업체 간 상호운용성과 광 및 구리 상호 연결 옵션의 다양성을 보장한다.
울랄과 홀브룩은 “ESUN은 SUE-T 기반 전송 계층을 포함한 모든 상위 계층 전송 기술을 지원하도록 설계됐다”고 밝혔다. SUE-T(Scale-Up Ethernet Transport)는 브로드컴이 OCP에 기여한 SUE(Scale-Up Ethernet) 기술을 기반으로 한 새로운 OCP 프로젝트다. 이 프로젝트는 신뢰성 스케줄링, 로드밸런싱, 트랜잭션 패킹 등 AI 워크로드의 핵심 성능 향상 기능을 ESUN 기반 XPU에 쉽게 통합할 수 있도록 기능을 정의하는 것을 목표로 한다.
울랄과 홀브룩은 “결국 ESUN 프레임워크는 개별 가속기를 하나의 강력한 AI 슈퍼컴퓨터로 결합할 수 있게 하며, 네트워크 성능이 AI 모델의 개발 및 실행 속도, 효율성과 직접적으로 연결된다”고 설명했다. 또한, “ESUN과 SUE-T의 계층적 구조는 이더넷 위에서 혁신을 촉진하면서도 단편화를 방지한다”고 덧붙였다.
가트너 “AI 네트워킹 패브릭, 2029년까지 폭발적 성장 전망”
가트너는 최근 보고서를 통해 확장형 AI 패브릭(Scale-Up AI Fabrics, SAIF) 기술이 최근 업계의 주목을 받고 있으며, 2029년까지 AI 인프라 확장을 지원하는 핵심 기술로 급성장할 것으로 전망했다.
가트너는 “SAIF는 고대역폭·저지연 물리 네트워크 연결성과 AI 프로세서 간 향상된 메모리 상호작용을 제공한다”라며, “현재 대부분의 SAIF 구현은 솔루션 업체의 독자 플랫폼 형태이며, 물리적 거리 제약으로 인해 랙이나 열(row) 단위로 제한되는 경우가 많다. 이런 상황에서 여러 SAIF 시스템을 연결할 때는 이더넷을 사용하는 것이 가장 바람직하다. 이더넷은 확장성, 성능, 지원 측면에서 최적의 선택”이라고 평가했다.
또한 “2025년부터 2027년 사이에 엔비디아의 SAIF 솔루션을 포함한 다양한 기술 전환이 일어날 것”이라며 “2025년 중반 기준 SAIF 시장은 여전히 엔비디아가 주도하고 있으며, 엔비디아는 마벨, 후지쯔, 퀄컴, 아스테라 랩스와 협력해 자사 SAIF 솔루션(NVlink 퓨전)과 직접 통합할 수 있도록 NVlink 기술을 확장하고 있다”고 전했다.
가트너는 “UALink 등 경쟁 기술 생태계가 부상하면서 멀티벤더 환경이 조성되고, 그 결과 유연성이 확대되고 종속성이 줄어드는 등 경쟁이 한층 치열해질 것”이라고 전망했다.
[email protected]