얼마 전에 개최된 CES 2025 행사에서 엔비디아의 CEO 젠슨 황은 자사의 '코스모스(COSMOS)'를 공개했다. COSMOS(코스모스)는 Cloud Orchestrator Services and Management for Omniverse and Simulation의 약자로, ✅ 기존의 디지털 트윈 및 시뮬레이션 기반의 산업을 근간으로 하여 AI 로봇 훈련 및 관리를 위해 고안된 클라우드에 기반한 인프라 오케스트레이션 플랫폼이다. 무슨 내용인지 어려울 수도 있겠지만, 하나씩 살펴보면 그렇게 어려운 것도 아니니 걱정 말고 읽어보자.
앞서 이야기했듯, 코스모스는 ✅ 디지털 트윈기반의 산업에서 AI 훈련을 위한 플랫폼이다. 여기서 디지털 트윈 기반의 산업이란, 3D 시뮬레이션 가상 공간에서 공장이나 물류 센터 및 자율주행 차량 등의 실제 시스템을 가상으로 재현하는 산업을 의미한다. 엔비디아는 이러한 가상 현실을 구현할 수 있도록 하는 플랫폼을 내놓았는데, 그것이 바로 옴니버스(Omniverse) 플랫폼이다. 즉, 실제와 같은 가상 환경을 만들고 AI 모델을 가상 환경에 떨어뜨려 놓고 실제 세계에서 발생하는 것과 동일한 사건들을 발생시키며 AI를 학습시키는 것이다. 이러한 방식의 AI 학습이 필요한 이유는 바로 자율주행이나 로봇 등과 같이 정교한 데이터 처리가 이루어지지 않으면 사람의 안전에도 영향을 미칠 수 있는 분야가 존재하기 때문이다. 따라서 사람의 안전과 무관한 가상 세계에서 반복적인 시뮬레이션을 통해 AI가 데이터를 올바르게 처리할 수 있게끔 학습시키는 것이다.
NVIDIA Omniverse에서 구현된 가상 환경 (출처: blogs.nvidia.co.kr)
이제 옴니버스가 '가상 현실에서 AI가 스스로 학습할 수 있도록 물리 데이터를 기반으로 가상 현실을 실제 현실과 똑같이 만들 수 있도록 하는 플랫폼'이라는 것을 이해했을 것이다. 그렇다면 옴니버스 기반의 산업에서 AI 훈련을 위한 플랫폼이라는 건 무슨 말일까 ? 간단히 구분하자면 옴니버스는 물리적으로 현실과 거의 동일한 가상 환경을 만들 수 있도록 해주는 플랫폼이고, 코스모스는 옴니버스와 같은 플랫폼에서 만들어낸 가상 환경에서 AI가 여러 가지 데이터를 학습할 수 있도록 해주는 플랫폼이다. 다시 말해, 👍 엔비디아의 코스모스 플랫폼은 엔비디아의 옴니버스 플랫폼을 포함하여 데이터의 흐름을 통제하거나 시뮬레이션을 활용한 운영 오케스트레이션을 지원하는 등 옴니버스보다 더 넓은 범위에서 작동하는 것이다.
NVIDIA COSMOS 플랫폼을 통해 학습하는 AI 로봇 (출처: blogs.nvidia.co.kr)
위의 이미지만 봐도 알 수 있듯이, 엔비디아는 단순히 AI 학습을 위한 GPU를 공급하는 것을 넘어 옴니버스와 코스모스라는 두 가지 개발 플랫폼을 사용자에게 제공함으로써 AI 발전을 이끌어나가고 싶다는 의지를 표명하고 있는 것이다.
728x90
꼭 엔비디아의 코스모스여야만 하나 ?
앞서 살펴봤듯, 엔비디아에서 제공하는 옴니버스 플랫폼과 코스모스 플랫폼은 자율주행과 로봇 공학 AI를 학습시키기 위해서는 아주 좋은 개발 도구라는 점에 대해서는 이견이 없다. 하지만 이러한 플랫폼을 엔비디아만 만들고 엔비디아만 공급하고 있을까 ? 결론부터 이야기하자면 그건 명확하게도 아니다. 실제로 게임 회사로 유명한 1️⃣ 유니티는 Forge라는 플랫폼을 통해 3D 설계부터 시뮬레이션까지 가능한 클라우드 API를 제공하고 있고, 2️⃣ 마이크로소프트는 Azure Digital Twins라는 플랫폼을 통해 IoT를 기반으로 하는 디지털 트윈 플랫폼을 제공하고 있다. 하지만 엔비디아의 옴니버스와 코스모스가 갖고 있는 장점은 아주 확실하며, 개발자들이 엔비디아의 플랫폼을 사용해야 하는 이유 역시 명확하다. 바로 AI 학습을 위한 GPU를 어느 기업에서 설계하고 공급하고 있는지를 떠올려보면 된다. 엔비디아는 데이터 센터 GPU 공급 시장에서 94%, 거의 독점에 가까운 점유율을 차지하고 있을 정도로 높은 시장 장악력을 가지고 있다. 물론 AMD도 괜찮은 성능의 GPU(MI 300, MI400 등)를 만들어내고 있긴 하지만, AMD의 시장 점유율은 터무니없이 적은 것이 현실이다.
데이터 센터 GPU 시장 점유율 (출처: wccftech.com)
그렇다면 엔비디아의 GPU 시장 점유율이 높다는 게 옴니버스와 코스모스 플랫폼을 사용해야 하는 근거가 될 수 있을까 ? 그렇다. 일례로 삼성전자의 갤럭시와 애플의 아이폰을 비교해보자. 애플의 경우에는 자체적인 소프트웨어인 IOS를 직접 개발하고 이를 아이폰과 아이패드, 맥북 등에 탑재하고 있지만 갤럭시의 경우에는 구글의 소프트웨어인 안드로이드를 탑재해서 판매하고 있다. 물론 안드로이드의 수준이 많이 높아진 건 사실이지만, 핸드폰을 사용하는 과정에서 느껴지는 부드러움과 통합성 및 호환성은 애플의 IOS에 비하면 한참 밀린다. 뿐만 아니라 소프트웨어와 하드웨어 간 호환성에 대해서도 떠올려볼 수 있다. 갤럭시의 안드로이드는 구글에서 만들어놓고 핸드폰에 사용되는 CPU는 퀄컴 사의 스냅드래곤을 쓰거나 삼성전자의 엑시노스를 탑재하는 과정에서 예상치 못한 발열이 발생하는 등의 문제점이 발생하는데 반해, 애플의 경우에는 자사에서 만든 IOS와 자사에서 만든 M2 칩 등을 탑재하여 발열과 호환성 등 모든 성능을 다 잘 잡아내고 있다. 같은 맥락에서 엔비디아의 AI GPU와 옴니버스 및 코스모스라는 플랫폼을 떠올려보자. 만약 두 개의 회사가 똑같이 엔비디아의 블랙웰 GPU를 활용한다고 하더라도, 마이크로소프트의 플랫폼을 활용하여 개발하는 것과 엔비디아의 플랫폼을 활용하여 개발하는 것 간에는 결과물에 있어서 명확한 차이점을 만들어낼 수 있다. 엔비디아 입장에서는 GPU라는 내 새끼가 어떻게 크는지 내가 직접 봤듯, 어떤 상황에서 어떻게 행동할지 눈에 뻔히 보이니 그에 알맞게 플랫폼을 만들어낸 것이고 이 플랫폼은 결국 좋은 효율성을 만들어낼 수밖에 없다는 말이다. 좋은 효율성이라는 단어로 퉁치기 뭐할 정도로 코스모스 플랫폼은 GPU 자원을 효과적으로 사용할 수 있도록 하는 기능을 제공하고 있다. 이와 같은 하드웨어와 소프트웨어의 호환성 및 효율성 측면이 아니라 하더라도 ✅ '25년 6월 지금까지 AI GPU 인프라와 시뮬레이션 엔진, 그리고 AI 학습 파이프라인를 통합한 엔비디아 수준의 플랫폼은 아직 어느 기업도 제시하지 못하고 있다.
마치며,
언젠가 한 번 쯤은 '핸드폰을 바꾸려니 노트북도 같이 바꿔야 좋고 무선 이어폰도 같은 회사 거로 바꿔야 좋더라'는 이야기를 듣거나 생각을 해본 적이 있을 것이다. 과거 애플이 자신만의 생태계를 구성하고 사용자들이 그 생태계에서 벗어날 수 없도록 최대한 유기적으로 작동하게끔 만들었고, 이를 지켜보다 못한 삼성 역시 자신들만의 생태계를 만들어 사용자들이 벗어날 수 없도록 하기 위해 ATIV라는 노트북 이름을 갤럭시북으로 바꾸고 갤럭시 버즈를 만들어 갤럭시 생태계를 만들고자 했었다. 이러한 배경에서 삼성이 만들어낸 것이 퀵쉐어나 클립보드 공유 등과 같은 기능들이다. 이처럼, 엔비디아도 이제는 엔비디아의 AI GPU가 가지는 지위를 더욱 공고히 하고 다른 기업의 AI GPU로 빠져나갈 수 없도록 만들기 위해 🤝 엔비디아 생태계를 구축하는 것이다. 옴니버스와 코스모스가 갖는 의의는 그러하다.