Deepseek AI Development: 1,6 miliarda dolarów, obalanie mitu przystępności cenowej
Chatbot Deepseek, który wprowadził się z intrygującą linią „Cześć, zostałam stworzona, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”, szybko pojawił się jako potężny konkurent na rynku AI. Jego wpływ był tak znaczący, że doprowadził do jednego z największych spadków cen akcji w Nvidii. Osiągnięcie to zakorzenione jest w innowacyjnym podejściu Deepseek do architektury modelowej i metod treningowych.
Model Deepseek wyróżnia się ze względu na wykorzystanie kilku zaawansowanych technologii. Pierwszym z nich jest prognozowanie wielu tokenów (MTP) , gdzie model przewiduje wiele słów jednocześnie poprzez analizę różnych części zdania. To nie tylko poprawia dokładność, ale także zwiększa wydajność. Kolejną kluczową cechą jest mieszanka architektury ekspertów (MOE) , która wykorzystuje 256 sieci neuronowych, aktywując osiem dla każdego zadania przetwarzania tokenów. To przyspiesza szkolenie i zwiększa wydajność. Wreszcie, wielokrotna uwaga utajona (MLA) koncentruje się na kluczowych częściach zdania, wielokrotnie wyodrębniając kluczowe szczegóły w celu przechwytywania ważnych niuansów w danych wejściowych.
Zdjęcie: engame.com
Deepseek, wybitny chiński startup, twierdzi, że opracował ten konkurencyjny model sztucznej inteligencji przy minimalnych kosztach. Stwierdzają, że wydali tylko 6 milionów dolarów na szkolenie Deepseek V3, wykorzystując zaledwie 2048 procesorów graficznych. Jednak analitycy z semianalizy odkryli, że Deepseek prowadzi rozległą infrastrukturę obliczeniową, obejmującą około 50 000 GPU Nvidia Hopper, w tym 10 000 jednostek H800, 10 000 H100 i dodatkowych GPU H20. Zasoby te są rozpowszechniane na wiele centrów danych i wykorzystywane do szkolenia AI, badań i modelowania finansowego.
Zdjęcie: engame.com
Całkowita inwestycja Spółki w serwerach wynosi około 1,6 mld USD, a wydatki operacyjne szacowane są na 944 mln USD. Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odciągnęła startup w 2023 r., Aby skupić się na technologiach AI. W przeciwieństwie do większości startupów, Deepseek jest właścicielem swoich centrów danych, umożliwiając pełną kontrolę nad optymalizacją modelu AI i szybszą implementację innowacji. Firma pozostaje finansowana, zwiększając swoją elastyczność i szybkość podejmowania decyzji.
Zdjęcie: engame.com
Ponadto Deepseek przyciąga najlepsze talenty wiodących chińskich uniwersytetów, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie. Pomimo roszczenia firmy o wydawanie zaledwie 6 milionów dolarów na szkolenie, liczba ta uwzględnia tylko wykorzystanie GPU podczas wstępnego treningu i wyklucza koszty badań, udoskonalanie modelu, przetwarzanie danych i koszty infrastruktury. Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jego kompaktowa struktura umożliwia aktywne i skuteczne wdrażanie innowacji AI.
Zdjęcie: engame.com
Przykład Deepseek pokazuje, że dobrze finansowana, niezależna firma AI może konkurować z liderami branży. Jednak eksperci zauważają, że sukces firmy wynika z znacznych inwestycji, przełom technicznych i silnym zespołem, a nie „rewolucyjnym budżetem” dla opracowywania modeli AI. Mimo to koszty Deepeek pozostają niższe niż koszty jego konkurentów; Na przykład, podczas gdy Deepseek wydał 5 milionów dolarów na R1, Chatgpt4O kosztował 100 milionów dolarów na trening.
-
Jul 02,22Isophyne debiutuje jako oryginalna postać w Marvel Contest of Champions Kabam wprowadza zupełnie nową, oryginalną postać do Marvel Contest of Champions: Isophyne. Ten wyjątkowy bohater, świeże dzieło twórców Kabama, może poszczycić się uderzającym designem przypominającym film Avatar, zawierającym metaliczne akcenty w kolorze miedzi. Rola Isophyne w konkursie Isophyne ent
-
Jan 27,25Roblox: kody rowerowe (styczeń 2025) Bike Obby: Odblokuj niesamowite nagrody za pomocą tych kodów Roblox! Bike Obby, kurs przeszkód rowerowych Roblox, pozwala zdobyć walutę w grze, aby zaktualizować rower, kupić wzmacniacze i dostosowywanie jazdy. Opanowanie różnych utworów wymaga roweru na najwyższym poziomie i na szczęście te kody obby rowerowe dostarczają
-
Feb 20,25Gdzie zamawiać w przedsprzedaży smartfony Samsung Galaxy S25 i S25 Seria Samsunga Galaxy S25: głębokie nurkowanie w składzie 2025 Samsung zaprezentował bardzo oczekiwaną serię Galaxy S25 na tegorocznym wydarzeniu rozpakowanym. Skład ma trzy modele: Galaxy S25, S25+i S25 Ultra. Wstępne są już otwarte, a wysyłka rozpoczyna się 7 lutego. Sieć Samsunga
-
Mar 04,25Feather God pływa na iOS, teraz otwarta rejestracja! The Godfeather: Wojna mafii z gołębią przybywa na iOS 15 sierpnia! Pre-Register Now For the Godfeather: A Mafia Pigeon Saga, roguelike puzzle-akcja uruchomiona na iOS 15 sierpnia! Uniknąć patrolu Pidge, uwolnij swój ptak arsenał (ahem, odchody) i odzyskaj dzielnicę z obu H