Desenvolvimento da AI Deepseek: US $ 1,6 bilhão gasto, desmistificando o mito da acessibilidade
O chatbot de Deepseek, que se apresentou com a linha intrigante "Oi, eu fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo", rapidamente emergiu como um concorrente formidável no mercado de IA. Seu impacto foi tão significativo que levou a uma das maiores quedas de preço das ações da NVIDIA. Essa conquista está enraizada na abordagem inovadora da Deepseek para os métodos de arquitetura e treinamento de modelos de IA.
O modelo de Deepseek se destaca devido ao uso de várias tecnologias avançadas. O primeiro é a previsão de vários toques (MTP) , onde o modelo prevê várias palavras ao mesmo tempo analisando diferentes partes de uma frase. Isso não apenas melhora a precisão, mas também aumenta a eficiência. Outra característica essencial é a mistura da arquitetura de especialistas (MOE) , que emprega 256 redes neurais, ativando oito para cada tarefa de processamento de token. Isso acelera o treinamento e aumenta o desempenho. Por fim, a atenção latente de várias cabeças (MLA) se concentra nas partes cruciais de uma frase, extraindo repetidamente os principais detalhes para capturar nuances importantes nos dados de entrada.
Imagem: Ensigame.com
A Deepseek, uma proeminente startup chinesa, afirma ter desenvolvido esse modelo competitivo de IA a um custo mínimo. Eles afirmam que gastaram apenas US $ 6 milhões no treinamento do Deepseek V3, utilizando apenas 2048 processadores gráficos. No entanto, analistas da semiânica descobriram que a DeepSeek opera uma vasta infraestrutura computacional, compreendendo cerca de 50.000 GPUs NVIDIA Hopper, incluindo 10.000 unidades H800, 10.000 H100s e GPUs H20 adicionais. Esses recursos estão espalhados por vários data centers e usados para treinamento, pesquisa e modelagem financeira de IA.
Imagem: Ensigame.com
O investimento total da empresa em servidores é de aproximadamente US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões. A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que saiu da startup em 2023 para se concentrar nas tecnologias de IA. Diferentemente da maioria das startups, a DeepSeek possui seus data centers, permitindo o controle total sobre a otimização do modelo de IA e a implementação mais rápida da inovação. A empresa permanece autofinanciada, aumentando sua flexibilidade e velocidade de tomada de decisão.
Imagem: Ensigame.com
Além disso, a Deepseek atrai os principais talentos das principais universidades chinesas, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente. Apesar da reivindicação da empresa de gastar apenas US $ 6 milhões em treinamento, esse número é responsável apenas pelo uso da GPU durante o pré-treinamento e exclui despesas de pesquisa, refinamento de modelos, processamento de dados e custos de infraestrutura. Desde a sua criação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura compacta permite implementar inovações de IA ativa e eficaz.
Imagem: Ensigame.com
O exemplo da Deepseek demonstra que uma empresa de IA independente e bem financiada pode competir com os líderes do setor. No entanto, os especialistas observam que o sucesso da empresa se deve a investimentos significativos, avanços técnicos e uma equipe forte, em vez de um "orçamento revolucionário" para o desenvolvimento de modelos de IA. Apesar disso, os custos da Deepseek permanecem inferiores aos de seus concorrentes; Por exemplo, enquanto Deepseek gastou US $ 5 milhões em R1, o ChatGPT4O custou US $ 100 milhões para treinar.
-
Jul 02,22Isophyne estreia como personagem original em Marvel Torneio de Campeões Kabam apresenta um novo personagem original para Marvel Torneio de Campeões: Isophyne. Este campeão único, uma nova criação dos desenvolvedores da Kabam, possui um design marcante que lembra o filme Avatar, incorporando detalhes metálicos em tons de cobre. O papel de Isophyne no concurso Isophyne ent
-
Dec 13,24Genshin Impact Cai no Aquário S.E.A para uma aventura aquática Prepare-se para uma aventura "fin-tástica"! MAR. Aquarium e Genshin Impact estão unindo forças para o Teyvat S.E.A. Evento de exploração, que acontece de 12 de setembro a 28 de outubro de 2024. Esta colaboração única marca a primeira vez que Genshin Impact faz parceria com um aquário, oferecendo uma experiência única
-
Jan 27,25Roblox: Códigos Bike Obby (janeiro de 2025) Bike Obby: Desbloqueie recompensas impressionantes com esses códigos Roblox! Bike Obby, a pista de obstáculos do Roblox Cycling, permite ganhar moeda no jogo para atualizar sua bicicleta, comprar boosters e personalizar seu passeio. Dominar as várias faixas requer uma bicicleta de primeira linha e, felizmente, esses códigos de obby de bicicleta entregam
-
May 18,24Acolyte se junta ao Grimguard Tactics na atualização de conteúdo Grimguard Tactics, o RPG de fantasia sombria baseado em história, recebe uma grande atualização de conteúdo em 28 de novembro! Um mês após seu lançamento para Android e iOS, os jogadores podem esperar novas adições emocionantes: O Acólito, uma nova classe de heróis de suporte, entra na briga. Este personagem dobrador de sangue exerce