DeepSeek AI Development: 1,6 млрд. Долл.
Чатбот DeepSeek, который предстал перед интригующей линией «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас», быстро стал грозным конкурентом на рынке искусственного интеллекта. Его влияние было настолько значительным, что привело к одному из крупнейших падений цен на акции Nvidia. Это достижение основано на инновационном подходе DeepSeek к архитектуре моделей ИИ и методам обучения.
Модель DeepSeek выделяется из -за его использования нескольких передовых технологий. Первым является предсказание мульти-ток (MTP) , где модель предсказывает несколько слов одновременно, анализируя различные части предложения. Это не только повышает точность, но и повышает эффективность. Другой ключевой особенностью является смесь архитектуры экспертов (MOE) , в которой используются 256 нейронных сетей, активируя восемь для каждой задачи обработки токенов. Это ускоряет обучение и повышает производительность. Наконец, мультиголовое скрытое внимание (MLA) фокусируется на важных частях предложения, неоднократно извлекая ключевые детали для захвата важных нюансов во входных данных.
Изображение: Ensigame.com
DeepSeek, известный китайский стартап, утверждает, что разработал эту конкурентную модель искусственного интеллекта с минимальными затратами. Они заявляют, что потратили всего 6 миллионов долларов на обучение DeepSeek V3, используя всего 2048 графических процессоров. Тем не менее, аналитики полуанализа обнаружили, что DeepSeek управляет обширной вычислительной инфраструктурой, включающей около 50 000 графических процессоров NVIDIA, в том числе 10 000 единиц H800, 10 000 H100 и дополнительных графических процессоров H20. Эти ресурсы распространяются по нескольким центрам обработки данных и используются для обучения, исследований и финансового моделирования искусственного интеллекта.
Изображение: Ensigame.com
Общие инвестиции компании в серверы составляют приблизительно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США. DeepSeek является дочерней компанией китайского хедж-фонда High-Fund, который отказался от стартапа в 2023 году, чтобы сосредоточиться на технологиях искусственного интеллекта. В отличие от большинства стартапов, DeepSeek владеет своими центрами обработки данных, позволяя полному контролю над оптимизацией модели искусственного интеллекта и более быстрой реализации инноваций. Компания остается самофинансированной, повышая свою гибкость и скорость принятия решений.
Изображение: Ensigame.com
Более того, Deepseek привлекает лучшие таланты от ведущих китайских университетов, а некоторые исследователи зарабатывают более 1,3 миллиона долларов в год. Несмотря на претензию компании о тратях всего 6 миллионов долларов на обучение, эта цифра учитывает только использование графического процессора во время предварительного обучения и исключает расходы на исследовательские расходы, уточнение модели, обработку данных и затраты на инфраструктуру. С момента своего создания DeepSeek инвестировала более 500 миллионов долларов в разработку ИИ. Его компактная структура позволяет активно и эффективно реализовать инновации искусственного интеллекта.
Изображение: Ensigame.com
Пример DeepSeek демонстрирует, что хорошо финансируемая независимая компания по искусству может конкурировать с лидерами отрасли. Тем не менее, эксперты отмечают, что успех компании связан с значительными инвестициями, техническими прорывами и сильной командой, а не «революционным бюджетом» для разработки моделей ИИ. Несмотря на это, затраты Deepseek остаются ниже, чем у его конкурентов; Например, в то время как Deepseek потратил 5 миллионов долларов на R1, Chatgpt4o стоил 100 миллионов долларов на тренировку.
-
Jul 02,22Изофина дебютирует как оригинальный персонаж в Marvel Contest of Champions Кабам представляет в Marvel Contest of Champions совершенно нового оригинального персонажа: Изофину. Этот уникальный чемпион, свежее творение разработчиков Kabam, может похвастаться ярким дизайном, напоминающим фильм «Аватар», с металлическими акцентами медного оттенка. Роль Изофина в соревновании Изофин энт
-
Jan 27,25Roblox: Коды велосипедов (январь 2025 г.) Bike Obby: Разблокируйте потрясающие награды с этими кодами Roblox! Bike Obby, Roblox Cycling Trabling Absustcle Bourse, позволяет вам зарабатывать в игровой валюте, чтобы обновить свой велосипед, купить бустеры и настроить поездку. Освоение различных треков требует велосипеда высшего уровня, и, к счастью, эти коды велосипедов доставляют
-
Feb 20,25Где предварительно заказать смартфоны Samsung Galaxy S25 и S25 Ultra Серия Samsung Galaxy S25: глубокое погружение в линейку 2025 года. Samsung представила свою долгожданную серию Galaxy S25 на беспорядке в этом году. В линейке есть три модели: Galaxy S25, S25+и S25 Ultra. Предварительные заказы теперь открыты, с доставкой, начиная с 7 февраля. Samsung's Web
-
Mar 04,25Godfeather поднимается на iOS, предварительная регистрация открыта сейчас! Голфизер: 4 августа прибывает война с голубей мафии! Предварительная регистрация теперь для Godfeather: мафиовая сага, голубь-сага, игра с головоломкой Roguelike, запущенная на iOS 15 августа! Уклониться от патруля Pidge, развязать свой птичий арсенал (хм, помещение) и восстановить окрестности из обоих h