by Ava Feb 28,2025
Deepseekの驚くほど費用対効果の高いAIモデルは、業界の巨人に挑戦しています。同社の新しいチャットボットは印象的な能力を誇っており、市場の大幅な混乱とNvidiaの株式に影響を与えています。その成功は、革新的なテクノロジーと実質的な投資の組み合わせに由来し、最小限のトレーニングコストの最初の主張と矛盾しています。
画像:Ensigame.com
DeepSeek V3は最先端のテクニックを活用します:マルチトークン予測(MTP)精度と効率を向上させるため。 エキスパート(MOE)の混合、256のニューラルネットワークを利用して、加速トレーニングとパフォーマンスの向上。 マルチヘッドの潜在的な注意(MLA)重要な詳細が見落とされていないことを確認します。
画像:Ensigame.com
Deepseekは当初、わずか600万ドルのトレーニングコストを主張していましたが、Semianalysisの報告書は、はるかに大きな投資を明らかにしています。彼らのインフラストラクチャは約50,000のNVIDIA GPUで構成され、約16億ドルで、運用コストは9億4,400万ドルに達しました。これは、最初の低コストの物語と矛盾しています。
画像:Ensigame.com
Deepseekの独立した構造、データセンターの所有権、および中国のトップの才能を引き付ける高い給与は、その成功に貢献しています。 600万ドルの数字は、トレーニング前のGPUコストのみを反映しており、調査、洗練、データ処理、インフラストラクチャを省略しています。総AI開発投資は5億ドルを超えています。一部の研究者の年間130万ドルを超える高給は、多額の投資をさらに強調しています。
画像:Ensigame.com
Deepseekの例は、資金提供された独立したAI企業が効果的に競争できることを示しています。しかし、その成功は、実質的な投資、技術の進歩、および熟練したチームに大きく依存しています。 「革新的な予算」の請求は誤解を招きますが、そのコストは競合他社よりも大幅に低いままです(たとえば、DeepseekのR1はChatGPT 4の1億ドルに対して500万ドルです)。
Zenless Zone Zeroアップデートサイクルリークは、将来のコンテンツケイデンスのヒント
原神 のすべての Mavuika マテリアル、キット、コンステレーション
Balatro は Friends of Jimbo 3 アップデートで 8 つのフランチャイズとさらに無謀な騒乱を追加
子供向けベスト Xbox Game Pass ゲーム (2025 年 1 月)
ソロ レベリング: 世界トーナメントが近づく
マーベル ライバルズ: シーズン 1 ドラキュラの解説
パワーレンジャー: リタのカーニバルと墓地に隠された秘密を暴こう
Mitaカートリッジ互換性を発表します:簡単に識別するための包括的なガイド