DeepSeek каже, що витратив $6 млн на свою модель. Що з цим не так
Акції американських технологічних компаній обвалила не лише новина про вихід штучного інтелекту від DeepSeek, а й заява про вартість тренування їхньої моделі DeepSeek-V3. Компанія стверджує, що витратила на тренування «всього» $5,576 млн. На хвилі хайпу та паніки чимало трактували цю цифру, як начебто компанія DeepSeek всього витратила близько $6 млн і виникає питання, навіщо тоді нам OpenAI і чому вони залучають мільярди доларів інвестицій?

Після спаду першої паніки, до цифри у $6 млн витрат почали виникати питання, оскільки для багатьох вона виглядає нереальною. Хоча скоріше правильно буде вказати, що не зовсім правильним виглядало саме трактування цієї цифри.
Як пояснює видання Barrons, вже згадані $6 млн — це лише вартість останнього тренувального запуску моделі, що займає 2,8 мільйона годин GPU у випадку оренди такої кількості хмарних ресурсів. Більше детально про схему підрахунків можна побачити тут.
Навіть у самій DeepSeek визнають, що витрати у $6 млн — це лише історія про тренування. У документації компанії є фраза «витрати включають лише офіційне навчання DeepSeek-V3, за винятком витрат, пов’язаних з попередніми дослідженнями та експериментами». Іншими словами, DeepSeek виключила велику кількість інших витрат та інвестиції, які були спрямовані на те, що це тренування взагалі стало можливим.
Експерти, опитані Barrons, стверджують: мова про $6 млн — це скоріше омана, аніж правда, і створити подібне всього за такі гроші — неможливо. Окремо потрібно рахувати всі кошти, що були витрачені на:
- розробку архітектури моделі, алгоритмів.
- збір даних.
- зарплати співробітників.
- придбання графічних процесорів
- тестування.
Ніхто не береться назвати точну цифру, оскільки немає детальної інформації по роботі команди, але мова про значно більші інвестиції. Зекономити можливо було лише коштом американських розробок, якими користувались китайські інженери (а тепер їхніми напрацюваннями скористаються американські).
Одна з причин, чому відбувається така секретність — небажання прямо говорити про залежність від чіпів Nvidia, поставки яких до Китаю обмежені. Вказавши, що компанія може мати їх десятки чи сотні тисяч — це додаткові питання, як вони могли туди потрапити?
Оманливість цифри у $6 млн доводите і останнє повідомлення від уряду Китаю стосовно підтримки індустрії розвитку AI-технологій. У січні 2025 року було оголошено про виділення 1 трильйону юанів для підтримки цієї сфери. Мова про $140 млрд лише державних субсидій. Вже в такому форматі цифри — співмірні з тим, про що говорять у США: проєкт Stargate на першому етапі якраз і планується у $100 млрд. Інвестиції окремих компаній також вражають: Meta планує інвестувати до $65 млрд.
DeepSeek каже, що витратив $6 млн на свою модель. Що з цим не так
Акції американських технологічних компаній обвалила не лише новина про вихід штучного інтелекту від DeepSeek, а й заява про вартість тренування їхньої моделі DeepSeek-V3. Компанія стверджує, що витратила на тренування «всього» $5,576 млн. На хвилі хайпу та паніки чимало трактували цю цифру, як начебто компанія DeepSeek всього витратила близько $6 млн і виникає питання, навіщо тоді нам OpenAI і чому вони залучають мільярди доларів інвестицій?

Після спаду першої паніки, до цифри у $6 млн витрат почали виникати питання, оскільки для багатьох вона виглядає нереальною. Хоча скоріше правильно буде вказати, що не зовсім правильним виглядало саме трактування цієї цифри.
Як пояснює видання Barrons, вже згадані $6 млн — це лише вартість останнього тренувального запуску моделі, що займає 2,8 мільйона годин GPU у випадку оренди такої кількості хмарних ресурсів. Більше детально про схему підрахунків можна побачити тут.
Навіть у самій DeepSeek визнають, що витрати у $6 млн — це лише історія про тренування. У документації компанії є фраза «витрати включають лише офіційне навчання DeepSeek-V3, за винятком витрат, пов’язаних з попередніми дослідженнями та експериментами». Іншими словами, DeepSeek виключила велику кількість інших витрат та інвестиції, які були спрямовані на те, що це тренування взагалі стало можливим.
Експерти, опитані Barrons, стверджують: мова про $6 млн — це скоріше омана, аніж правда, і створити подібне всього за такі гроші — неможливо. Окремо потрібно рахувати всі кошти, що були витрачені на:
- розробку архітектури моделі, алгоритмів.
- збір даних.
- зарплати співробітників.
- придбання графічних процесорів
- тестування.
Ніхто не береться назвати точну цифру, оскільки немає детальної інформації по роботі команди, але мова про значно більші інвестиції. Зекономити можливо було лише коштом американських розробок, якими користувались китайські інженери (а тепер їхніми напрацюваннями скористаються американські).
Одна з причин, чому відбувається така секретність — небажання прямо говорити про залежність від чіпів Nvidia, поставки яких до Китаю обмежені. Вказавши, що компанія може мати їх десятки чи сотні тисяч — це додаткові питання, як вони могли туди потрапити?
Оманливість цифри у $6 млн доводите і останнє повідомлення від уряду Китаю стосовно підтримки індустрії розвитку AI-технологій. У січні 2025 року було оголошено про виділення 1 трильйону юанів для підтримки цієї сфери. Мова про $140 млрд лише державних субсидій. Вже в такому форматі цифри — співмірні з тим, про що говорять у США: проєкт Stargate на першому етапі якраз і планується у $100 млрд. Інвестиції окремих компаній також вражають: Meta планує інвестувати до $65 млрд.