Deepseek AI -Entwicklung: 1,6 Milliarden US -Dollar ausgegeben, Erschwinglichkeit Mythos entlarvt

Apr 15,25

Deepseeks Chatbot, der sich mit der faszinierenden Zeile vorstellte. Seine Auswirkungen waren so wichtig, dass es zu einem der größten Aktienkurs von NVIDIA führte. Diese Leistung basiert auf Deepseeks innovativem Ansatz für die KI -Modellarchitektur und die Trainingsmethoden.

Das Modell von Deepseek ist aufgrund der Verwendung mehrerer fortschrittlicher Technologien auffällt. Die erste ist die Mehrfachgefahr-Vorhersage (MTP) , wobei das Modell mehrere Wörter gleichzeitig durch Analyse verschiedener Teile eines Satzes vorhersagt. Dies verbessert nicht nur die Genauigkeit, sondern verbessert auch die Effizienz. Ein weiteres Schlüsselmerkmal ist die Mischung aus Experten (MOE) -Scharchitektur, die 256 neuronale Netzwerke verwendet, die acht für jede Token -Verarbeitungsaufgabe aktivieren. Dies beschleunigt das Training und stärkt die Leistung. Zuletzt konzentriert sich die latente Aufmerksamkeit (MLA) mit mehreren Latenten auf wichtige Teile eines Satzes und extrahiert wiederholt Schlüsseldetails, um wichtige Nuancen in den Eingabedaten zu erfassen.

Deepseek -Test Bild: Ensigame.com

Deepseek, ein prominentes chinesisches Startup, behauptet, dieses wettbewerbsfähige KI -Modell zu minimalen Kosten entwickelt zu haben. Sie geben an, dass sie nur 6 Millionen US -Dollar für die Schulung von Deepseek V3 ausgegeben haben, wobei nur 2048 Grafikprozessoren verwendet wurden. Analysten aus der semianalyse haben jedoch aufgedeckt, dass Deepseek eine riesige Computerinfrastruktur betreibt, die rund 50.000 Nvidia Hopper -GPUs umfasst, darunter 10.000 H800 -Einheiten, 10.000 H100 und zusätzliche H20 -GPUs. Diese Ressourcen werden über mehrere Rechenzentren verbreitet und für KI -Schulungen, Forschung und Finanzmodellierung verwendet.

Deepseek v3 Bild: Ensigame.com

Die Gesamtinvestition des Unternehmens in Server beträgt ungefähr 1,6 Milliarden US -Dollar, wobei die operativen Ausgaben auf 944 Mio. USD geschätzt werden. Deepseek ist eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, das 2023 das Startup ausschaltete, um sich auf KI-Technologien zu konzentrieren. Im Gegensatz zu den meisten Startups besitzt Deepseek seine Rechenzentren und ermöglicht die volle Kontrolle über die AI -Modelloptimierung und eine schnellere Innovationsimplementierung. Das Unternehmen bleibt selbst finanziert und verbessert seine Flexibilität und Entscheidungsgeschwindigkeit.

Deepseek Bild: Ensigame.com

Darüber hinaus zieht Deepseek Top -Talente von führenden chinesischen Universitäten an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen. Trotz der Behauptung des Unternehmens, nur 6 Millionen US-Dollar für Schulungen auszugeben, macht diese Zahl nur die GPU-Nutzung während der Vorausbildung aus und schließt Forschungskosten, Modellverfeinerungen, Datenverarbeitung und Infrastrukturkosten aus. Seit seiner Gründung hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Seine kompakte Struktur ermöglicht es ihm, KI -Innovationen aktiv und effektiv umzusetzen.

Deepseek Bild: Ensigame.com

Das Beispiel von Deepseek zeigt, dass ein gut finanziertes, unabhängiges KI-Unternehmen mit Branchenführern konkurrieren kann. Experten stellen jedoch fest, dass der Erfolg des Unternehmens auf erhebliche Investitionen, technische Durchbrüche und ein starkes Team und nicht auf ein "revolutionäres Budget" für die Entwicklung von KI -Modellen zurückzuführen ist. Trotzdem bleiben Deepseeks Kosten niedriger als die seiner Konkurrenten. Während Deepseek beispielsweise 5 Millionen US -Dollar für R1 ausgab, kostete Chatgpt4O 100 Millionen US -Dollar, um zu trainieren.

Top-Nachrichten
Mehr
Copyright © 2024 godbu.com All rights reserved.