Desarrollo de AI Deepseek: $ 1.6 mil millones gastados, desacreditando el mito de asequibilidad
Chatbot de Deepseek, que se presentó con la línea intrigante "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda", se ha convertido rápidamente en un competidor formidable en el mercado de IA. Su impacto fue tan significativo que condujo a una de las mayores caídas del precio de las acciones de Nvidia. Este logro se basa en el enfoque innovador de Deepseek para la arquitectura del modelo de IA y los métodos de capacitación.
El modelo de Deepseek se destaca debido al uso de varias tecnologías avanzadas. El primero es la predicción múltiple (MTP) , donde el modelo predice múltiples palabras a la vez analizando diferentes partes de una oración. Esto no solo mejora la precisión, sino que también mejora la eficiencia. Otra característica clave es la mezcla de la arquitectura de expertos (MOE) , que emplea 256 redes neuronales, activando ocho para cada tarea de procesamiento de tokens. Esto acelera el entrenamiento y aumenta el rendimiento. Por último, la atención latente de múltiples cabezas (MLA) se centra en partes cruciales de una oración, extrayendo repetidamente detalles clave para capturar matices importantes en los datos de entrada.
Imagen: ensigame.com
Deepseek, una prominente startup china, afirma haber desarrollado este modelo de IA competitivo a un costo mínimo. Afirman que gastaron solo $ 6 millones en capacitar a Deepseek V3, utilizando solo 2048 procesadores gráficos. Sin embargo, los analistas del semianálisis han descubierto que Deepseek opera una vasta infraestructura computacional, que comprende alrededor de 50,000 GPU de tolva NVIDIA, incluidas 10,000 unidades H800, 10,000 H100 y GPU H20 adicionales. Estos recursos se distribuyen en múltiples centros de datos y se utilizan para capacitación de IA, investigación y modelado financiero.
Imagen: ensigame.com
La inversión total de la compañía en servidores es de aproximadamente $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones. Deepseek es una subsidiaria del Fondo de cobertura chino High-Flyer, que salió de la startup en 2023 para centrarse en las tecnologías de IA. A diferencia de la mayoría de las nuevas empresas, Deepseek posee sus centros de datos, lo que permite un control total sobre la optimización del modelo de IA y la implementación de innovación más rápida. La compañía sigue siendo autofinanciada, mejorando su flexibilidad y velocidad de toma de decisiones.
Imagen: ensigame.com
Además, Deepseek atrae al máximo talento de las principales universidades chinas, con algunos investigadores ganando más de $ 1.3 millones anuales. A pesar del reclamo de la compañía de gastar solo $ 6 millones en capacitación, esta cifra solo representa el uso de la GPU durante la capacitación previa y excluye los gastos de investigación, el refinamiento del modelo, el procesamiento de datos y los costos de infraestructura. Desde su inicio, Deepseek ha invertido más de $ 500 millones en desarrollo de IA. Su estructura compacta le permite implementar innovaciones de IA de manera activa y efectiva.
Imagen: ensigame.com
El ejemplo de Deepseek demuestra que una compañía de IA independiente bien financiada puede competir con los líderes de la industria. Sin embargo, los expertos señalan que el éxito de la compañía se debe a importantes inversiones, avances técnicos y un equipo fuerte, en lugar de un "presupuesto revolucionario" para desarrollar modelos de IA. A pesar de esto, los costos de Deepseek siguen siendo más bajos que los de sus competidores; Por ejemplo, mientras Deepseek gastó $ 5 millones en R1, ChatGPT4O costó $ 100 millones para entrenar.
-
Jul 02,22Isophyne debuta como personaje original en Marvel Batalla de Superhéroes Kabam presenta un personaje original completamente nuevo a Marvel Batalla de Superhéroes: Isophyne. Este campeón único, una nueva creación de los desarrolladores de Kabam, cuenta con un diseño llamativo que recuerda a la película Avatar, incorporando detalles metálicos en tonos cobrizos. El papel de Isophyne en el concurso isófilo ent
-
Jan 27,25Roblox: Códigos Bike Obby (enero de 2025) Bike Obby: ¡Desbloquea increíbles recompensas con estos códigos de Roblox! Bike Obby, la carrera de obstáculos ciclistas de Roblox, te permite ganar dinero en el juego para mejorar tu bicicleta, comprar potenciadores y personalizar tu recorrido. Dominar las distintas pistas requiere una bicicleta de primer nivel y, afortunadamente, estos códigos de Bike Obby lo ofrecen.
-
Feb 20,25Dónde reservar los teléfonos ultra inteligentes Samsung Galaxy S25 y S25 Serie Galaxy S25 de Samsung: una inmersión profunda en la línea 2025 Samsung presentó su muy esperada serie Galaxy S25 en el evento desempaquetado de este año. La alineación presenta tres modelos: el Galaxy S25, S25+y S25 Ultra. Los pedidos anticipados están abiertos ahora, con el envío que comienza el 7 de febrero. Samsung's Web
-
Mar 04,25¡El Godfeather se abre a iOS, preinscripción abierta ahora! The Godfeather: ¡una guerra de la mafia alimentada con palomas llega al iOS 15 de agosto! Pre-registrado ahora para Godfeather: ¡Una saga de palomas de la mafia, un juego de acertación de rompecabezas de Roguelike que se lanza el 15 de agosto de iOS! Evadir la Pidge Patrol, desatar su arsenal aviar (ejem, excrementos) y reclamar el vecindario de ambos H