Китайская модель ИИ DeepSeek R1 обучена за $294 тыс. — в сотни раз дешевле, чем у OpenAI
- AlexT
- 19-сен-2025, 09:00
- 0 комментариев
- 17 просмотров
Китайская компания DeepSeek раскрыла детали о затратах на обучение своей рассуждающей модели искусственного интеллекта DeepSeek R1. По данным, опубликованным в научном журнале Nature, обучение модели обошлось всего в $294 тыс., что в разы дешевле аналогичных проектов конкурентов из США.
Создание больших языковых моделей (LLM), которые лежат в основе современных чат-ботов и генеративного ИИ, обычно требует колоссальных затрат на аренду и эксплуатацию вычислительных кластеров. Однако в случае DeepSeek R1 расходы оказались минимальными — всего $294 тыс. против более $100 млн у OpenAI, как ранее заявлял глава компании Сэм Альтман. Таким образом, разрыв в затратах достигает примерно 340 раз.
В статье Nature указано, что обучение модели DeepSeek R1 проводилось на кластере из 512 ускорителей Nvidia H800. По словам исследователей, весь процесс занял около 80 часов.
Интересно, что на ранних этапах разработки компания также использовала графические процессоры Nvidia A100 для предварительных экспериментов с меньшими моделями. Этот факт DeepSeek подтвердила в дополнительном отчёте, опубликованном вместе с материалом в Nature.
Американские официальные лица и представители технологических компаний выразили сомнение в правдивости некоторых заявлений DeepSeek. В частности, высказывались подозрения, что компания могла использовать запрещённые для китайского рынка ускорители Nvidia H100, доступ к которым был ограничен экспортным контролем США ещё в 2022 году.
Однако Nvidia опровергла эти предположения, уточнив, что DeepSeek легально использовала именно H800, разработанные специально для китайского рынка.
Запуск доступных систем искусственного интеллекта от DeepSeek в январе вызвал серьёзную реакцию на мировом рынке. Инвесторы начали массово избавляться от акций технологических компаний из опасений, что дешёвые ИИ-решения из Китая могут подорвать позиции американских игроков.
С тех пор компания DeepSeek и её основатель Лян Вэньфэн (Liang Wenfeng) практически не появлялись в публичном поле, ограничиваясь редкими анонсами обновлений продуктов. Публикация в Nature стала первым официальным подтверждением деталей обучения R1 и косвенно вернула компанию в центр внимания.
DeepSeek R1 — это пример того, как китайские компании находят способы резко снизить стоимость разработки систем искусственного интеллекта. Если данные окажутся достоверными, то модель, обученная всего за $294 тыс., может стать символом новой эры доступного ИИ и серьёзным вызовом для западных конкурентов.