Deepseek AI gelişimi: 1,6 milyar dolar harcandı, satın alınabilirlik mitini bozuyor

Apr 15,25

Deepseek'in kendisini ilgi çekici "Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz", AI pazarında zorlu bir rakip olarak hızla ortaya çıktı. Etkisi o kadar önemliydi ki, Nvidia'nın en büyük hisse senedi fiyat düşüşlerinden birine yol açtı. Bu başarı Deepseek'in AI model mimarisine ve eğitim yöntemlerine yenilikçi yaklaşımından kaynaklanmaktadır.

Deepseek'in modeli, birkaç ileri teknolojiyi kullanması nedeniyle öne çıkıyor. Birincisi, modelin bir cümlenin farklı kısımlarını analiz ederek aynı anda birden fazla kelimeyi öngördüğü çoklu eğimli tahmin (MTP) . Bu sadece doğruluğu artırmakla kalmaz, aynı zamanda verimliliği de artırır. Bir diğer önemli özellik, 256 sinir ağı kullanan ve her jeton işleme görevi için sekiz'i etkinleştiren uzmanlar (MOE) mimarisinin karışımıdır . Bu, eğitimi hızlandırır ve performansı artırır. Son olarak, çok başlı gizli dikkat (MLA) bir cümlenin önemli kısımlarına odaklanır ve giriş verilerindeki önemli nüansları yakalamak için önemli ayrıntıları tekrar tekrar çıkarır.

Deepseek Testi Resim: ensigame.com

Önemli bir Çin girişim olan Deepseek, bu rekabetçi AI modelini minimum maliyetle geliştirdiğini iddia ediyor. Sadece 2048 grafik işlemcisi kullanarak Deepseek V3 eğitimine sadece 6 milyon dolar harcadıklarını belirtiyorlar. Bununla birlikte, Semianaliz analistleri, Deepseek'in 10.000 H800 birim, 10.000 H100s ve ek H20 GPU'lar dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları içeren geniş bir hesaplama altyapısı işlettiğini ortaya çıkardılar. Bu kaynaklar birden fazla veri merkezine yayılmıştır ve AI eğitimi, araştırma ve finansal modelleme için kullanılmaktadır.

Deepseek V3 Resim: ensigame.com

Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar $ 'dır ve operasyonel giderlerin 944 milyon $ olduğu tahmin edilmektedir. Deepseek, 2023'te AI teknolojilerine odaklanmak için girişimden çıkmış olan Çin Hedge Fonu High-Flyer'in bir yan kuruluşudur. Çoğu girişimin aksine, Deepseek veri merkezlerine sahiptir ve AI model optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlar. Şirket, esnekliğini ve karar verme hızını artırarak kendi kendini finanse ediyor.

Deepseek Resim: ensigame.com

Dahası, Deepseek önde gelen Çin üniversitelerinden en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde. Şirketin eğitim için sadece 6 milyon dolar harcama iddiasına rağmen, bu rakam yalnızca eğitim öncesi sırasında GPU kullanımını açıklar ve araştırma giderlerini, model arıtımını, veri işleme ve altyapı maliyetlerini hariç tutar. Deepseek, kuruluşundan bu yana AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Kompakt yapısı, AI yeniliklerini aktif ve etkili bir şekilde uygulamasını sağlar.

Deepseek Resim: ensigame.com

Deepseek'in örneği, iyi finanse edilen, bağımsız bir AI şirketinin endüstri liderleriyle rekabet edebileceğini göstermektedir. Bununla birlikte, uzmanlar, şirketin başarısının AI modelleri geliştirmek için "devrimci bir bütçe" yerine önemli yatırımlar, teknik atılımlar ve güçlü bir ekipten kaynaklandığını belirtiyor. Buna rağmen, Deepseek'in maliyetleri rakiplerinden daha düşüktür; Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4o'nun eğitilmesi 100 milyon dolara mal oldu.

En Önemli Haberler
Daha
Copyright © 2024 godbu.com All rights reserved.