Ежедневные новости о ситуации в мире и России, сводка о пандемии Коронавируса, новости культуры, науки и шоу бизнеса

Заявление DeepSeek о низкой стоимости обучения ИИ и использовании всего 2048 GPU Nvidia опровергнуто аналитиками

Китайский стартап DeepSeek привлёк всеобщее внимание, заявив о создании конкурентоспособной модели искусственного интеллекта (ИИ) с минимальными затратами. Компания утверждала, что на обучение чат-бота было потрачено всего $6 млн и использовано 2048 графических процессоров (GPU). Однако отчёт SemiAnalysis показал, что вложено было не менее $1,6 млрд и использовано 50 000 GPU Nvidia.

Заявление DeepSeek о низкой стоимости обучения ИИ и использовании всего 2048 GPU Nvidia опровергнуто аналитиками

Согласно данным, DeepSeek управляет крупной вычислительной инфраструктурой, включающей около 50 000 GPU Hopper. Среди них числятся 10 000 H800 и 10 000 H100, а также дополнительные партии H20. Эти ресурсы распределены между несколькими центрами обработки данных и используются для обучения ИИ, научных исследований и финансового моделирования. Как сообщает Tom’s Hardware, общие капитальные затраты на серверы составили около $1,6 млрд, а операционные расходы оцениваются в $944 млн.

Напомним, DeepSeek появилась как дочерний проект китайского хедж-фонда High-Flyer, который с 2023 года выделил стартап в отдельное направление, сосредоточенное на технологиях ИИ. В отличие от большинства стартапов, которые арендуют мощности у облачных провайдеров, компания имеет собственные дата-центры, что даёт полный контроль в плане оптимизации ИИ-моделей и позволяет быстрее внедрять инновации. К тому же, поскольку DeepSeek остаётся полностью самофинансируемой организацией, любые решения принимаются быстрее и гибче, делая компанию более эффективной по сравнению с традиционными игроками рынка.

Читать также:
36 000 графических процессоров AMD создали крупнейшую модель Вселенной

Особого внимания заслуживает кадровая политика. Компания нанимает специалистов исключительно из Китая, делая акцент на навыках и способности решать сложные задачи, а не на формальных дипломах. При этом зарплаты некоторых исследователей в DeepSeek превышают $1,3 млн в год, что позволяет привлекать таланты из ведущих университетов страны.

Хотя DeepSeek позиционирует себя как новатора, способного бросить вызов лидерам отрасли, аналитики SemiAnalysis подчёркивают, что успех компании основан на многомиллиардных инвестициях, технических прорывах и сильной команде, а заявления о «революционном бюджете», затраченном на ИИ-модель, могут быть преувеличены.