Китайская модель ИИ DeepSeek R1 обучена за $294 тыс. — в сотни раз дешевле, чем у OpenAI » У айтишки - Новости кино, игр, IT, интернета

Китайская модель ИИ DeepSeek R1 обучена за $294 тыс. — в сотни раз дешевле, чем у OpenAI

AlexT
19-сен-2025, 09:00
0 комментариев
150 просмотров

Китайская компания DeepSeek раскрыла детали о затратах на обучение своей рассуждающей модели искусственного интеллекта DeepSeek R1. По данным, опубликованным в научном журнале Nature, обучение модели обошлось всего в $294 тыс., что в разы дешевле аналогичных проектов конкурентов из США.

Стоимость обучения DeepSeek R1

Создание больших языковых моделей (LLM), которые лежат в основе современных чат-ботов и генеративного ИИ, обычно требует колоссальных затрат на аренду и эксплуатацию вычислительных кластеров. Однако в случае DeepSeek R1 расходы оказались минимальными — всего $294 тыс. против более $100 млн у OpenAI, как ранее заявлял глава компании Сэм Альтман. Таким образом, разрыв в затратах достигает примерно 340 раз.

Технические детали: сколько ускорителей потребовалось

В статье Nature указано, что обучение модели DeepSeek R1 проводилось на кластере из 512 ускорителей Nvidia H800. По словам исследователей, весь процесс занял около 80 часов.

Интересно, что на ранних этапах разработки компания также использовала графические процессоры Nvidia A100 для предварительных экспериментов с меньшими моделями. Этот факт DeepSeek подтвердила в дополнительном отчёте, опубликованном вместе с материалом в Nature.

Политический контекст и сомнения в заявлениях DeepSeek

Американские официальные лица и представители технологических компаний выразили сомнение в правдивости некоторых заявлений DeepSeek. В частности, высказывались подозрения, что компания могла использовать запрещённые для китайского рынка ускорители Nvidia H100, доступ к которым был ограничен экспортным контролем США ещё в 2022 году.

Однако Nvidia опровергла эти предположения, уточнив, что DeepSeek легально использовала именно H800, разработанные специально для китайского рынка.

Реакция на рынке и влияние на индустрию

Запуск доступных систем искусственного интеллекта от DeepSeek в январе вызвал серьёзную реакцию на мировом рынке. Инвесторы начали массово избавляться от акций технологических компаний из опасений, что дешёвые ИИ-решения из Китая могут подорвать позиции американских игроков.

С тех пор компания DeepSeek и её основатель Лян Вэньфэн (Liang Wenfeng) практически не появлялись в публичном поле, ограничиваясь редкими анонсами обновлений продуктов. Публикация в Nature стала первым официальным подтверждением деталей обучения R1 и косвенно вернула компанию в центр внимания.

Итог

DeepSeek R1 — это пример того, как китайские компании находят способы резко снизить стоимость разработки систем искусственного интеллекта. Если данные окажутся достоверными, то модель, обученная всего за $294 тыс., может стать символом новой эры доступного ИИ и серьёзным вызовом для западных конкурентов.