by Ava Feb 28,2025
DeepSeek의 놀랍도록 비용 효율적인 AI 모델은 업계 거인에게 도전합니다. 이 회사의 새로운 챗봇은 인상적인 기능을 자랑하여 시장 혼란이 크게 중단되고 Nvidia의 주식에 영향을 미칩니다. 성공은 혁신적인 기술과 실질적인 투자의 조합에서 비롯되어 최소 교육 비용의 초기 주장과 모순됩니다.
이미지 : ensigame.com
DeepSeek V3는 최첨단 기술을 활용합니다. 정확도와 효율성을 향상시키기위한 MTP (Multi-Token Prediction) ; 전문가 혼합 (MOE) , 256 개의 신경망을 활용하여 가속화 된 교육 및 성능 향상; 그리고 MLA (Multi-Head Sentent Interection) 중요한 세부 사항은 간과되지 않도록합니다.
이미지 : ensigame.com
DeepSeek은 처음에는 6 백만 달러의 교육 비용을 주장했지만 Semianalysis 보고서에 따르면 훨씬 더 많은 투자가 나타납니다. 그들의 인프라는 약 50,000 개의 NVIDIA GPU로 구성되며 약 16 억 달러의 가치가 있으며 운영 비용은 9 억 9,400 만 달러에 이릅니다. 이것은 초기 저비용 이야기와 모순됩니다.
이미지 : ensigame.com
DeepSeek의 독립적 인 구조, 데이터 센터의 소유권 및 최고급 중국 인재를 유치하는 높은 급여는 성공에 기여합니다. 6 백만 달러 규모의 수치는 사전 훈련 GPU 비용, 연구, 개선, 데이터 처리 및 인프라를 생략하는 것만 반영합니다. 총 AI 개발 투자는 5 억 달러를 초과합니다. 일부 연구자들에게 매년 130 만 달러를 초과하는 높은 급여는 상당한 투자를 강조합니다.
이미지 : ensigame.com
DeepSeek의 예에 따르면 잘 자금을 지원하는 독립 AI 회사가 효과적으로 경쟁 할 수 있습니다. 그러나 성공은 상당한 투자, 기술 발전 및 숙련 된 팀에 크게 의존합니다. "혁신적인 예산"주장은 오해의 소지가 있지만, 비용은 경쟁 업체보다 훨씬 낮게 유지됩니다 (예 : DeepSeek의 R1은 5 백만 달러에 비해 Chatgpt 4의 1 억 달러).