Pembangunan AI DeepSeek: $ 1.6 bilion dibelanjakan, membatalkan mitos kemampuan
Chatbot Deepseek, yang memperkenalkan dirinya dengan garis yang menarik "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda," telah muncul dengan cepat sebagai pesaing yang hebat di pasaran AI. Impaknya sangat penting sehingga ia membawa kepada salah satu penurunan harga saham terbesar di Nvidia. Pencapaian ini berakar dalam pendekatan inovatif DeepSeek terhadap model seni bina dan kaedah latihan AI.
Model DeepSeek menonjol kerana penggunaan beberapa teknologi canggih. Yang pertama adalah ramalan multi-token (MTP) , di mana model meramalkan beberapa perkataan sekaligus dengan menganalisis bahagian-bahagian yang berlainan dari ayat. Ini bukan sahaja meningkatkan ketepatan tetapi juga meningkatkan kecekapan. Satu lagi ciri utama ialah Campuran Seni Bina Pakar (MOE) , yang menggunakan 256 rangkaian saraf, mengaktifkan lapan untuk setiap tugas pemprosesan token. Ini mempercepat latihan dan meningkatkan prestasi. Akhir sekali, Perhatian Laten Multi-Head (MLA) memberi tumpuan kepada bahagian-bahagian penting ayat, berulang kali mengeluarkan butiran utama untuk menangkap nuansa penting dalam data input.
Imej: ensigame.com
Deepseek, permulaan Cina yang terkenal, mendakwa telah membangunkan model AI yang kompetitif ini dengan kos yang minimum. Mereka menyatakan bahawa mereka hanya menghabiskan $ 6 juta untuk latihan DeepSeek v3, menggunakan hanya 2048 pemproses grafik. Walau bagaimanapun, penganalisis dari semianalysis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengiraan yang luas, yang terdiri daripada sekitar 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800 unit, 10,000 H100s, dan GPU tambahan H20. Sumber -sumber ini tersebar di pelbagai pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.
Imej: ensigame.com
Jumlah pelaburan syarikat dalam pelayan adalah kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta. DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan pada tahun 2023 untuk memberi tumpuan kepada teknologi AI. Tidak seperti kebanyakan pemula, DeepSeek memiliki pusat datanya, yang membolehkan kawalan penuh ke atas pengoptimuman model AI dan pelaksanaan inovasi yang lebih cepat. Syarikat itu tetap dibiayai sendiri, meningkatkan kelajuan fleksibiliti dan membuat keputusan.
Imej: ensigame.com
Lebih -lebih lagi, DeepSeek menarik bakat teratas dari universiti -universiti China yang terkemuka, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun. Walaupun tuntutan perbelanjaan syarikat hanya $ 6 juta untuk latihan, angka ini hanya menyumbang penggunaan GPU semasa latihan pra-latihan dan tidak termasuk perbelanjaan penyelidikan, penghalusan model, pemprosesan data, dan kos infrastruktur. Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur padatnya membolehkannya melaksanakan inovasi AI secara aktif dan berkesan.
Imej: ensigame.com
Contoh DeepSeek menunjukkan bahawa syarikat AI yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar -pakar mencatatkan bahawa kejayaan syarikat adalah disebabkan oleh pelaburan yang signifikan, kejayaan teknikal, dan pasukan yang kuat, bukannya "anggaran revolusioner" untuk membangunkan model AI. Walaupun begitu, kos DeepSeek kekal lebih rendah daripada pesaingnya; Sebagai contoh, sementara DeepSeek membelanjakan $ 5 juta pada R1, chatgpt4o berharga $ 100 juta untuk melatih.
-
Jul 02,22Isophyne Debut sebagai Watak Asal dalam Marvel Contest of Champions Kabam memperkenalkan watak asli yang serba baharu kepada Marvel Contest of Champions: Isophyne. Juara unik ini, ciptaan baru daripada pembangun Kabam, mempunyai reka bentuk menarik yang mengingatkan filem Avatar, yang menggabungkan aksen metalik tona tembaga. Peranan Isophyne dalam Peraduan Isophyne ent
-
Jan 27,25Roblox: Kod Obby Basikal (Januari 2025) Bike Obby: Buka Kunci Ganjaran Hebat dengan Kod Roblox Ini! Bike Obby, laluan halangan berbasikal Roblox, membolehkan anda memperoleh mata wang dalam permainan untuk meningkatkan basikal anda, membeli penggalak dan menyesuaikan tunggangan anda. Menguasai pelbagai trek memerlukan basikal peringkat teratas, dan syukur, kod Bike Obby ini disampaikan
-
Feb 20,25Di mana untuk menyusun semula telefon pintar Samsung Galaxy S25 dan S25 Ultra Siri Galaxy S25 Samsung: menyelam mendalam ke dalam barisan 2025 Samsung melancarkan siri Galaxy S25 yang sangat dinanti -nantikan pada acara yang dibongkar tahun ini. Barisan ini mempunyai tiga model: Galaxy S25, S25+, dan S25 Ultra. Preorders dibuka sekarang, dengan penghantaran bermula pada 7 Februari. Web Samsung
-
Mar 04,25The Godfeather Swoops ke iOS, pra-pendaftaran dibuka sekarang! The Godfeather: Perang Mafia yang dibakar merpati tiba di iOS 15 Ogos! Pra-pendaftaran sekarang untuk The Godfeather: A Mafia Pigeon Saga, permainan teka-teki roguelike yang dilancarkan pada iOS 15 Ogos! Menghindari Patrol Pidge, melepaskan arsenal burung (ahem, kotoran), dan menuntut semula kejiranan dari kedua -dua h