by Ava Feb 28,2025
O modelo surpreendentemente econômico de Deepseek desafia os gigantes da indústria. O novo chatbot da empresa possui recursos impressionantes, levando a uma interrupção significativa do mercado e impactando as ações da Nvidia. Seu sucesso decorre de uma combinação de tecnologia inovadora e investimento substancial, contradizendo as reivindicações iniciais de custos mínimos de treinamento.
imagem: ensigame.com
Deepseek V3 Aproveita as técnicas de ponta: Previsão com vários toques (MTP) Para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais, para treinamento acelerado e desempenho aprimorado; e Atenção latente de várias cabeças (MLA) Para garantir que os detalhes cruciais não sejam esquecidos.
imagem: ensigame.com
Enquanto o Deepseek reivindicou inicialmente um mero custo de treinamento de US $ 6 milhões, um relatório de semiânica revela um investimento muito mais substancial. Sua infraestrutura compreende aproximadamente 50.000 GPUs da NVIDIA, avaliadas em aproximadamente US $ 1,6 bilhão, com custos operacionais atingindo US $ 944 milhões. Isso contradiz a narrativa inicial de baixo custo.
imagem: ensigame.com
A estrutura independente da Deepseek, a propriedade de seus data centers e os altos salários que atraem os principais talentos chineses contribuem para o seu sucesso. O número de US $ 6 milhões reflete apenas custos de GPU pré-treinamento, omitindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total em desenvolvimento de IA excede US $ 500 milhões. Altos salários, excedendo US $ 1,3 milhão anualmente para alguns pesquisadores, destacam ainda mais o investimento significativo.
imagem: ensigame.com
O exemplo da Deepseek mostra uma empresa independente de IA bem financiada pode competir de maneira eficaz. No entanto, seu sucesso depende muito de investimentos substanciais, avanços tecnológicos e uma equipe qualificada. A reivindicação do "orçamento revolucionário" é enganoso, embora seus custos permaneçam significativamente menores que os concorrentes (por exemplo, o R1 da Deepseek a US $ 5 milhões contra os US $ 100 milhões do ChatGPT 4).
Dicas de vazamento do ciclo de atualização zero da Zenless Zone na cadência de conteúdo futuro
Todos os materiais, kits e constelações Mavuika em Genshin Impact
Balatro adiciona 8 franquias e mais caos maluco com a atualização de Friends of Jimbo 3
Melhores Xbox Game Pass jogos para crianças (janeiro de 2025)
Nivelamento Solo: Torneio Global se Aproxima
Marvel Rivals: Drácula da 1ª temporada explicado
Power Rangers: descubra segredos ocultos no carnaval e no cemitério de Rita
Compatibilidade do cartucho da revelação Mita
Proxi: pré -encomenda agora com DLC exclusivo
Jul 25,2025
"A criação de Kelarr revelada em Heroes of May & Magic: Olden Era"
Jul 24,2025
MacBook Air M4 no início de 2025: revelado
Jul 24,2025
A febre de cozinha visa o recorde mundial do Guinness na celebração do 10º aniversário
Jul 24,2025
World of Warcraft: Flerunderstorm - todas as recompensas e quanto elas custam
Jul 24,2025