엔비디아 GTC 2026, 칩 7개를 한꺼번에 꺼내든 진짜 이유

4월 03, 2026

GTC 2026이 끝났다. 매년 봐도 이번엔 분위기가 달랐다. 젠슨 황이 무대에서 꺼낸 게 칩 하나가 아니라 풀스택 플랫폼 전체였기 때문이다. 칩 7개, 랙스케일 시스템 5개, 거기에 슈퍼컴퓨터까지. 키노트를 보면서 "이건 제품 런칭이 아니라 생태계 선언이구나" 싶었다. 한 번에 이만큼 쏟아낸 건 엔비디아 역사에서도 처음이다.

Vera Rubin, 에이전틱 AI를 위한 수직 통합

이번 GTC의 중심축은 단연 Vera Rubin 플랫폼이다. 단순히 새 GPU 하나 내놓은 게 아니다. 엔비디아 공식 블로그에 따르면 7개 칩과 5개 랙스케일 시스템, 그리고 슈퍼컴퓨터급 연산력을 하나의 플랫폼으로 묶은 풀스택 컴퓨팅 아키텍처다. 출하 시점은 2026년 하반기.

핵심 타깃은 에이전틱 AI다. 스스로 판단하고 행동하는 AI 에이전트를 대규모로 운용하려면 GPU 하나만 빨라서는 안 된다. 네트워크 대역폭, 메모리 일관성, 소프트웨어 최적화가 전부 맞물려야 한다. Vera Rubin은 이 전체를 엔비디아 자체 기술로 채운 완전 수직 통합 플랫폼이다.

솔직히 이 정도면 경쟁사가 따라잡을 틈이 있나 싶다. 칩 설계부터 시스템 아키텍처, CUDA 생태계까지 전부 자기네 것이니까. 에이전틱 AI가 다음 전장이라는 걸 엔비디아가 가장 먼저, 가장 크게 베팅한 셈이다.

DGX Station GB300: 책상 위에 올라온 슈퍼컴퓨터

개인적으로 가장 눈이 갔던 건 DGX Station GB300이다. "데스크탑 슈퍼컴퓨터"라는 표현이 마케팅 문구처럼 들리겠지만, 스펙을 보면 농담이 아니다.

748GB 코히어런트 메모리 — GPU와 CPU가 하나의 메모리 풀을 공유
FP4 기준 20 페타플롭스 — 불과 몇 년 전 국가급 슈퍼컴퓨터 수준
1조 파라미터 모델 로컬 구동 가능 — GPT-4급 모델을 클라우드 없이 돌린다는 뜻

엔비디아 뉴스룸에 따르면 ASUS, Dell, MSI 같은 OEM 파트너들이 수개월 내로 출하를 시작한다. 기업 R&D 팀이나 AI 스타트업 입장에서는 클라우드 API 비용 걱정 없이 자체 인프라를 확보할 수 있는 현실적인 선택지가 생긴 거다.

이건 좀 과장 아닌가 싶으면서도, 2년 전에 A100 하나 구하려고 대기 리스트에 이름 올리던 시절을 떠올리면 격세지감이 있다. 가격이 관건이겠지만, 엔비디아가 OEM 다변화를 서두르는 걸 보면 접근성을 꽤 의식하고 있는 것 같다.

RTX PRO 4500: 서버실의 조용한 혁명

RTX PRO 4500 Blackwell Server Edition. 이름은 길지만 핵심은 단순하다. 165W 싱글슬롯 폼팩터에 L4 대비 소형 언어 모델(SLM) 추론 10배, 비전 AI 성능 100배. 그리고 지금 바로 살 수 있다.

"지금 바로"가 중요하다. Vera Rubin은 하반기, DGX Station도 수개월 후인데, RTX PRO 4500은 오늘 주문하면 다음 주에 서버에 꽂을 수 있다. 엔터프라이즈 입장에서는 기존 랙 서버에 카드만 추가하면 AI 추론 인프라가 완성된다. 데이터센터 전체를 뜯어고칠 필요가 없다는 뜻이다.

실무 담당자 입장에서는 오히려 Vera Rubin보다 RTX PRO 4500이 더 반가울 수 있다. 예산 승인 받기도 훨씬 쉬울 테니까.

Feynman 아키텍처: 출하 전에 다음 세대를 예고하다

Vera Rubin이 아직 출하도 안 됐는데 벌써 그 다음 세대를 공개했다. 코드네임은 Feynman. 물리학자 리처드 파인만에서 따온 이름이다. 구성을 보면 야심이 장난 아니다.

Rosa CPU는 로잘린드 프랭클린(DNA 구조 발견에 기여한 과학자)에서 이름을 따왔고, 여기에 LP40 LPU(저전력 추론 전용 유닛), BlueField-5 DPU, 그리고 가장 주목할 만한 광학 네트워킹 기술이 포함된다.

광학 네트워킹이 왜 중요하냐면, 데이터센터 내부의 전기 신호 기반 통신이 이미 병목이 되고 있기 때문이다. 칩이 아무리 빨라져도 칩 사이의 데이터 전송이 느리면 전체 시스템 성능이 올라가지 않는다. 빛으로 이 병목을 깨겠다는 건데, 실현되면 단순 성능 향상이 아니라 데이터센터 설계 자체가 바뀐다. 엔비디아가 GPU 회사에서 AI 인프라 회사로 완전히 전환했다는 가장 확실한 증거다.

AMD MI500, 1000배라는 숫자의 무게

경쟁 구도도 빼놓을 수 없다. AMD는 MI500을 공개하면서 MI300X 대비 AI 성능 1000배 향상을 주장했다. 숫자만 보면 압도적인데, 솔직히 벤치마크 조건이나 실제 프로덕션 워크로드 기준이 아직 불투명해서 액면 그대로 받아들이긴 어렵다.

그래도 엔비디아 독주 체제에 균열이 생기는 건 업계 전체에 좋은 일이다. 경쟁이 있어야 가격이 내려가고, 가격이 내려가야 더 많은 팀이 AI 하드웨어에 접근할 수 있다. 2026년 1분기 글로벌 스타트업 투자가 $297B(약 400조 원)로 역대 최고를 찍었는데, 이 성장의 대부분을 AI 딜이 견인했다. 하드웨어 비용이 이 흐름의 병목이 되어서는 안 된다.

엔비디아의 채용 시그널

흥미로운 사이드 노트 하나. 다른 빅테크 기업들이 비용 절감을 이유로 H-1B 비자 채용을 줄이는 추세인데, 엔비디아만 오히려 채용을 늘리고 있다. 로드맵이 이렇게 빽빽하면 당연히 사람이 더 필요하다. 반대로 말하면, 엔비디아 스스로도 이 로드맵을 "진짜로" 실행할 생각이라는 방증이다. 채용 데이터는 IR 자료보다 솔직한 경우가 많다.

이전에 Test_Lab에서 다뤘던 Claude Code vs Codex, 삼성 Gemini 탑재, Apple Siri 개편 같은 소프트웨어 AI 경쟁도 결국 이 하드웨어 인프라 위에서 돌아간다. 모델이 아무리 똑똑해져도 연산력이 뒷받침되지 않으면 서비스로 내놓을 수 없다. GTC 2026은 그 연산력의 다음 챕터를 연 자리였다.

당장 눈여겨볼 것

실무에 즉시 영향을 주는 건 RTX PRO 4500(지금 구매 가능)과 수개월 내 출하되는 DGX Station GB300이다. Vera Rubin과 Feynman은 중장기 로드맵으로 봐야 한다. 엔비디아가 이렇게 빠르게 미래 로드맵까지 공개하는 건, 투자자와 고객 모두에게 "우리 플랫폼에 올라타도 된다"는 확신을 주려는 전략이다.

AI 하드웨어 전쟁은 이제 칩 하나의 벤치마크 경쟁이 아니다. 칩, 시스템, 네트워크, 소프트웨어를 누가 더 촘촘하게 엮느냐의 플랫폼 전쟁이 됐다. 엔비디아는 그 답을 GTC 2026에서 꽤 선명하게 내놨고, 공은 이제 AMD와 나머지 경쟁자들에게 넘어갔다.

숲성

OpenAI 170조 원 조달, AI 버블인가 진짜 시작인가