การพัฒนา AI Deepseek: ใช้จ่าย 1.6 พันล้านเหรียญสหรัฐ

Apr 15,25

แชทบ็อตของ Deepseek ซึ่งแนะนำตัวเองด้วยสายที่น่าสนใจ "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" ได้กลายเป็นคู่แข่งที่น่าเกรงขามในตลาด AI ผลกระทบของมันมีความสำคัญอย่างยิ่งที่นำไปสู่หนึ่งในราคาหุ้นที่ใหญ่ที่สุดของ Nvidia ความสำเร็จนี้มีรากฐานมาจากวิธีการที่เป็นนวัตกรรมของ Deepseek ในการสร้างสถาปัตยกรรมแบบจำลอง AI และวิธีการฝึกอบรม

โมเดลของ Deepseek โดดเด่นเนื่องจากการใช้เทคโนโลยีขั้นสูงหลายอย่าง ครั้งแรกคือ การทำนายแบบหลาย Token (MTP) ซึ่งแบบจำลองทำนายหลายคำพร้อมกันโดยการวิเคราะห์ส่วนต่าง ๆ ของประโยค สิ่งนี้ไม่เพียง แต่ช่วยเพิ่มความแม่นยำ แต่ยังช่วยเพิ่มประสิทธิภาพ คุณสมบัติที่สำคัญอีกประการหนึ่งคือ ส่วนผสมของสถาปัตยกรรมผู้เชี่ยวชาญ (MOE) ซึ่งใช้เครือข่ายประสาท 256 เครือข่ายเปิดใช้งานแปดสำหรับงานประมวลผลโทเค็นแต่ละงาน สิ่งนี้เร่งการฝึกอบรมและเพิ่มประสิทธิภาพ สุดท้าย ความสนใจแฝงหลายหัว (MLA) มุ่งเน้นไปที่ส่วนสำคัญของประโยคการสกัดรายละเอียดสำคัญซ้ำ ๆ เพื่อจับความแตกต่างที่สำคัญในข้อมูลอินพุต

การทดสอบลึกรูปภาพ: Ensigame.com

Deepseek การเริ่มต้นของจีนที่โดดเด่นอ้างว่าได้พัฒนาโมเดล AI ที่แข่งขันได้ด้วยค่าใช้จ่ายน้อยที่สุด พวกเขาระบุว่าพวกเขาใช้เงินเพียง 6 ล้านเหรียญสหรัฐในการฝึกอบรม Deepseek V3 โดยใช้โปรเซสเซอร์กราฟิกเพียง 2048 ตัว อย่างไรก็ตามนักวิเคราะห์จาก semianalysis ได้เปิดเผยว่า Deepseek ดำเนินการโครงสร้างพื้นฐานการคำนวณมากมายซึ่งประกอบด้วย GPU Nvidia Hopper ประมาณ 50,000 Nvidia รวมถึง 10,000 H800 หน่วย, 10,000 H100s และ H20 GPU เพิ่มเติม ทรัพยากรเหล่านี้กระจายไปทั่วศูนย์ข้อมูลหลายแห่งและใช้สำหรับการฝึกอบรม AI การวิจัยและการสร้างแบบจำลองทางการเงิน

deepseek v3 รูปภาพ: Ensigame.com

การลงทุนทั้งหมดของ บริษัท ในเซิร์ฟเวอร์อยู่ที่ประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานประมาณ 944 ล้านดอลลาร์ Deepseek เป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงของจีนซึ่งหมุนตัวออกจากการเริ่มต้นในปี 2566 เพื่อมุ่งเน้นไปที่เทคโนโลยี AI ซึ่งแตกต่างจาก startups ส่วนใหญ่ Deepseek เป็นเจ้าของศูนย์ข้อมูลช่วยให้สามารถควบคุมการเพิ่มประสิทธิภาพแบบจำลอง AI ได้อย่างเต็มที่และการใช้นวัตกรรมที่เร็วขึ้น บริษัท ยังคงได้รับเงินสนับสนุนตนเองเพิ่มความยืดหยุ่นและความเร็วในการตัดสินใจ

ลึกล้ำ รูปภาพ: Ensigame.com

ยิ่งไปกว่านั้น Deepseek ยังดึงดูดความสามารถระดับสูงจากมหาวิทยาลัยจีนชั้นนำโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปี แม้จะมีการเรียกร้องค่าใช้จ่ายของ บริษัท เพียง $ 6 ล้านในการฝึกอบรมตัวเลขนี้มีเพียงบัญชีสำหรับการใช้ GPU ในระหว่างการฝึกอบรมก่อนและไม่รวมค่าใช้จ่ายในการวิจัยการปรับแต่งแบบจำลองการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐาน นับตั้งแต่ก่อตั้งขึ้น Deepseek ได้ลงทุนกว่า 500 ล้านดอลลาร์ในการพัฒนา AI โครงสร้างขนาดกะทัดรัดช่วยให้สามารถใช้นวัตกรรม AI อย่างแข็งขันและมีประสิทธิภาพ

ลึกล้ำ รูปภาพ: Ensigame.com

ตัวอย่างของ Deepseek แสดงให้เห็นว่า บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีสามารถแข่งขันกับผู้นำอุตสาหกรรมได้ อย่างไรก็ตามผู้เชี่ยวชาญทราบว่าความสำเร็จของ บริษัท เกิดจากการลงทุนที่สำคัญการพัฒนาทางเทคนิคและทีมที่แข็งแกร่งแทนที่จะเป็น "งบประมาณปฏิวัติ" สำหรับการพัฒนาโมเดล AI อย่างไรก็ตามเรื่องนี้ค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าของคู่แข่ง ตัวอย่างเช่นในขณะที่ Deepseek ใช้จ่าย $ 5 ล้านใน R1 แต่ CHATGPT4O มีค่าใช้จ่าย $ 100 ล้านในการฝึกอบรม

ข่าวเด่น
มากกว่า
Copyright © 2024 godbu.com All rights reserved.