이 리포트는 AI 칩 시장의 주요 플레이어인 세레브라스 시스템, 엔비디아, 퓨리오사AI의 기술적 차별성과 시장 경쟁력을 분석합니다. 세레브라스 시스템은 웨이퍼 스케일 엔진(WSE)을 활용하여 메모리 병목 현상을 극복하고, 높은 처리 성능을 제공하며 AI 모델을 효율적으로 실행합니다. 엔비디아는 AI 칩 시장에서 높은 범용성과 성능을 바탕으로 지배적인 위치를 유지하고 있으나, 전력 효율성 문제를 해결해야 하는 과제를 안고 있습니다. 퓨리오사AI는 NPU 기반으로 전력 효율성을 높여, 전력 제약이 있는 환경에서도 효율적인 AI 솔루션을 제공합니다. 각 기업의 기술적 장단점과 전략을 통해 AI 칩 시장의 동향과 향후 방향성을 조명합니다.
세레브라스는 웨이퍼 크기의 AI 칩을 개발하여 NVIDIA의 GPU 시장에 도전하고 있습니다. 웨이퍼 스케일 엔진(WSE)은 44GB의 SRAM과 수많은 코어를 갖춘 대형 칩으로, 2.6조 개의 트랜지스터와 85만 개의 코어를 포함하고 있습니다. 이는 NVIDIA H100 GPU의 800억 개 트랜지스터와 1만9천 개 코어에 비해 월등히 많은 수치입니다. 세레브라스의 칩은 모델 전체를 큰 칩의 SRAM에 저장하여 HBM 메모리의 한계를 극복할 수 있습니다. 이러한 구조 덕분에 세레브라스는 AI 모델을 짧은 시간 내에 처리할 수 있는 능력을 보유하고 있습니다.
세레브라스의 CS-1 슈퍼컴퓨터는 약 4 엑사플롭의 성능을 제공합니다. CG-1 슈퍼컴퓨터는 32개의 세레브라스 칩과 82TB의 메모리로 구성되어 있으며, 총 72,700개의 AMD EPYC 코어를 통해 입력 및 출력을 처리합니다. 세레브라스에 따르면, CS-1은 Llama 3.1의 80억 개 파라미터 버전을 사용하여 클라우드 기반 NVIDIA H100 솔루션과 비교했을 때 20배 더 빠른 속도를 제공한다고 합니다. 이는 기업들이 AI 작업을 효율적으로 진행할 수 있도록 돕습니다.
세레브라스는 아부다비의 기술 대기업 G42와 1억 달러 규모의 계약을 체결하였습니다. 이 계약은 총 9개의 슈퍼컴퓨터 구축 계획의 첫 단계로, 첫 번째 시스템인 Condor Galaxy 1(CG-1)은 이미 운영 중입니다. CG-2와 CG-3은 2024년 초 텍사스 주 오스틴과 노스캐롤라이나 주 애슈빌에 개장할 예정입니다. G42는 이 네트워크를 통해 주로 헬스케어와 에너지 분야의 기업들에게 처리 능력을 제공할 계획입니다. 이 계약을 통해 세레브라스는 시장에서의 입지를 더욱 강화하게 됩니다.
엔비디아의 GPU는 AI 산업에서 '석유'로 비유될 만큼 높은 성능과 범용성을 자랑하고 있습니다. 엔비디아의 CEO인 젠슨 황은 AI 칩 시장에서 엔비디아가 차지하는 비율이 70%에서 95%에 이른다고 밝혔으며, 이는 고객들이 OpenAI의 GPT와 같은 모델을 훈련시키고 배포하는 데 있어 엔비디아의 제품을 선택하게 만드는 주요 요인입니다. 그러나 이에 대한 경쟁도 심화되고 있는 상황이며, 새로운 AI 반도체들이 엔비디아의 GPU보다 성능이 뛰어나기 위해 전력 사용량 대비 성능 향상에 주력하고 있습니다.
엔비디아의 GPU는 뛰어난 성능에도 불구하고 전력 효율성 문제에 직면해 있습니다. 엔비디아의 주요 경쟁사들은 전력 사용을 줄이면서 성능을 높이기 위한 대책을 모색하고 있으며, 이는 가격과 운영 비용 절감을 위한 필수 요소로 작용하고 있습니다. 퓨리오사AI는 전력 사용량 대비 성능을 강조하며 엔비디아의 제품을 능가해 나갈 것이라는 목표를 세우고 있습니다. 이러한 상황에서 엔비디아는 새로운 AI 칩 아키텍처를 매년 출시하겠다고 약속하고 있으며, 이는 미래의 전력 효율성 문제를 해결하기 위한 노력의 일환으로 해석됩니다.
AI 칩 시장에서의 경쟁은 갈수록 치열해지고 있습니다. 엔비디아는 여전히 시장의 주도권을 잡고 있지만, D-Matrix와 같은 신생 스타트업들이 차별화된 기술과 가격 경쟁력을 가지고 시장에 진입하고 있습니다. AMD와 인텔과 같은 기존의 대형 반도체 제조사들도 AI 기술을 위한 새로운 제품을 출시하며 경쟁에 나서고 있습니다. 특히, 시장 분석가들은 AI 칩 시장이 향후 5년 내에 연간 4000억 달러에 이를 것으로 예상하고 있습니다. 엔비디아의 수익은 약 800억 달러에 이르며, 최근 4분기 동안 AI 칩 관련 매출이 345억 달러에 달하는 것으로 보고되었습니다. 이처럼 AI 칩 시장은 다양한 기업들이 참여하며 더욱 복잡한 경쟁 구도를 형성하고 있습니다.
퓨리오사AI의 NPU는 성능과 효율성 측면에서 GPU를 능가하는 장점을 가지고 있습니다. 이러한 NPU는 이미 다양한 AI 서비스에서 그 유용성이 입증되고 있으며, 온디바이스 AI 개발을 위한 최적의 솔루션으로 자리잡고 있습니다. AI 반도체 성능 테스트에서 퓨리오사AI는 엔비디아의 GPU와 비교할 때 유의미한 차별화를 보여주며, 이를 통해 AI 앱서비스 개발 분야에서 엔비디아의 독점에 도전하고 있습니다.
퓨리오사AI의 NPU 기술은 전력 효율성을 크게 개선하는 특징이 있습니다. TCP(텐서 축약 프로세서)는 150W TDP를 자랑하며, 동일한 작업을 수행하는 데 있어 엔비디아의 H100(700W TDP) 대비 최대 2.7배의 와트당 성능을 제공합니다. TCP의 처리 성능은 FP8 기준으로 512 TFLOPS에 이르며, 이는 전력 제약이 있는 환경에서 매력적인 선택이 될 수 있습니다. 이를 통해 NPU는 전력 효율을 중시하는 다양한 AI 응용 프로그램의 요구에 부합합니다.
퓨리오사AI는 NPU의 가능성을 더욱 확장하고 있으며, 이를 위해 다양한시장 확대 전략을 추구하고 있습니다. 텐서 처리의 유연성을 높이기 위해 슬라이스라는 더 작은 단위로 작업을 분할하고, 고급 컴파일러를 통해 최적화를 수행합니다. 이로 인해 개발자들은 NPU를 효과적으로 활용할 수 있으며, AI 기술의 발전과 함께 퓨리오사AI는 시장에서 독립적인 생태계를 구축하기 위해 노력하고 있습니다. 향후 NPU는 AI 반도체 시장에서 중요한 역할을 할 것으로 기대됩니다.
AI 칩 시장에서 엔비디아의 GPU는 높은 범용성을 자랑하지만, 가격이 비쌓고 전력 소모가 커 전력 효율성이 떨어진다는 단점이 있습니다. 특히, 2023년 엔비디아의 데이터센터 사업 매출의 40% 이상이 추론에서 발생하였으며, 생성형 AI 서비스 확산으로 AI 반도체 성장의 축이 학습용 칩에서 추론용 칩으로 이동할 것으로 전망됩니다. 퓨리오사AI는 전력 효율성을 중시하며, 다음 분기에 출시될 '레니게이드S' NPU는 LPDDR 메모리를 탑재하여 효율적인 전력 관리를 지원할 것으로 기대됩니다. 이에 따라 AI 반도체의 수요는 점차 NPU 중심으로 변화하고 있습니다.
각 기술의 장단점에는 다음과 같은 사항이 있습니다. 엔비디아의 GPU는 뛰어난 범용성과 강력한 프로세싱 능력 덕분에 시장을 주도하고 있지만, 전력과 비용 문제는 해결해야 할 과제로 남아 있습니다. 반면에, 퓨리오사AI의 NPU는 전력 효율성이 높고 휴대용 기기에 적합하여 특정 수요를 충족시킵니다. 또한, LPDDR 메모리를 활용한 새로운 기술 개발이 진행되고 있으며, 이를 통해 메모리와 GPU 간의 병목 현상을 줄일 수 있는 가능성이 제시되고 있습니다. 따라서 NPU와 LPDDR 조합의 사용은 특정 AI 모델에 최적화된 솔루션이 될 수 있습니다.
리포트는 AI 칩 시장에서 세레브라스 시스템, 엔비디아, 퓨리오사AI의 접근 방식을 비교하며, 이들의 경쟁력이 어떻게 시장에 영향을 미치는지를 분석합니다. 세레브라스 시스템은 웨이퍼 스케일 엔진을 통해 혁신적인 성능 향상을 이루며 AI 처리의 병목 현상을 개선하고 있어, 시장 점유율 확대가 기대됩니다. 엔비디아는 여전히 GPU의 강력한 성능과 범용성으로 시장을 주도하고 있으나, 전력 소비와 비용 문제를 해결하는 것이 지속 가능한 성장을 위해 필요합니다. 퓨리오사AI는 NPU 기술을 통해 전력 효율성을 극대화하며 휴대용 기기나 전력 제한이 있는 환경에서의 활용성을 높이고 있습니다. 이와 같은 경쟁은 AI 응용 분야에 다양한 기술적 선택지를 제공하고 있으며, 앞으로도 AI 기술 발전과 시장 변화에 큰 기여를 할 것입니다. 하지만 모든 기업은 기술 발전의 한계를 인식하고 지속적인 혁신을 위해 시장 요구와 변화에 민첩하게 대응해야 합니다. 미래에는 NPU와 GPU 간의 균형 있는 발전이 기대되며, 각사의 기술이 실질적으로 어떻게 적용될지에 대한 연구가 필요합니다.
대규모 웨이퍼 스케일 엔진(WSE)을 개발하여 AI 칩 시장에서 혁신적인 기술을 제공하는 실리콘 밸리 기반 스타트업으로, AI 처리에서 병목현상을 해결하는 데 중점을 두고 있습니다.
AI 및 고성능 컴퓨팅 분야에서 GPU를 사용하여 시장을 지배하고 있는 선도적인 반도체 회사로, 범용성과 성능에서 강점을 보이고 있습니다.
NPU 기반의 AI 반도체를 제조하며, 전력 소모를 줄이고 효율성을 높이는 데 주력하여 AI 응용 서비스의 발전을 이끄는 업체입니다.