Китайская ИИ-модель GLM-5.2 от Z.ai: как санкции и ограничения ускорили конкуренцию с западными системами
- AlexT
- 23-июн-2026, 08:00
- 0 комментариев
- 6 просмотров

Китайская компания Z.ai представила модель GLM-5.2, которая сразу после релиза заняла лидирующие позиции в независимых рейтингах искусственного интеллекта. Особенность модели в том, что она была полностью обучена на китайских ускорителях Huawei Ascend 910B без использования оборудования Nvidia, что делает её одним из самых заметных примеров технологической автономии Китая в сфере ИИ.
Модель показала конкурентоспособные результаты в ряде бенчмарков и приблизилась к закрытым западным системам, включая решения уровня OpenAI и Anthropic. При этом GLM-5.2 распространяется как открытая модель с лицензией MIT, что позволяет запускать её локально, без ограничений и без привязки к API. На фоне экспортных ограничений США и попыток сдерживания китайского ИИ-сектора этот релиз стал демонстрацией того, что технологический разрыв между сторонами сокращается, хотя в наиболее сложных задачах рассуждения преимущество всё ещё остаётся за американскими моделями.
17 июня Z.ai опубликовала результаты тестирования модели GLM-5.2, а также открыла веса на платформе Hugging Face. Лицензия MIT делает модель полностью открытой для использования и локального развёртывания.
В рейтинге Artificial Analysis модель сразу поднялась на первое место, а в Code Arena, основанной на слепом сравнении ответов пользователей, GLM-5.2 заняла вторую позицию с результатом 1595 баллов. При этом среди доступных моделей она оказалась фактически лидером, так как один из конкурентов был исключён из выборки после ограничений на экспорт.
GLM-5.2 показала сильные результаты в практических тестах программирования и проектирования:
При этом в наиболее сложных задачах длительного агентного кодирования модель пока уступает лидерам, что показывает неравномерность прогресса: сильные результаты в прикладных задачах сочетаются с отставанием в долгосрочном планировании и сложном рассуждении.
Согласно индексу искусственного интеллекта Stanford University за 2026 год, разрыв между ведущими американскими и китайскими моделями сократился до 2,7 процентных пункта. Однако в наиболее сложных тестах на логическое мышление, специально разработанных для оценки устойчивости к манипуляциям и «заученным стратегиям», американские модели всё ещё сохраняют преимущество.
Дополнительные оценки Epoch AI указывают, что китайские разработки в среднем отстают примерно на семь месяцев по уровню передовых возможностей, хотя это отставание постепенно сокращается.
GLM-5.2 построена на архитектуре Mixture-of-Experts (MoE) с общим числом параметров около 744 млрд. При каждом запросе активируется лишь часть сети — примерно 40 млрд параметров. Система маршрутизации выбирает 8 из 256 экспертных подсетей для обработки каждого токена, снижая вычислительную нагрузку при сохранении высокой точности.
Ключевым элементом модели стала технология разрежённого внимания DeepSeek Sparse Attention (DSA). В отличие от классического квадратичного внимания, которое резко увеличивает стоимость обработки длинных последовательностей, DSA выбирает только наиболее значимые фрагменты контекста.
Благодаря этому GLM-5.2 способна работать с контекстом до 1 миллиона токенов, что делает возможной обработку больших кодовых баз и документов за один проход без разбиения на части.
Использование ускорителей Huawei Ascend 910B позволило обучить модель без зависимости от Nvidia, однако это повлияло на скорость вывода.
GLM-5.2 генерирует примерно 17–19 токенов в секунду, тогда как аналогичные модели на оборудовании Nvidia достигают 25–30 токенов и выше.
Также отмечается, что обучение модели заняло примерно на 15% больше вычислительного времени по сравнению с аналогами на Nvidia. Несмотря на это, общая стоимость обучения оценивается примерно в 25 млн долларов, что заметно ниже затрат на сопоставимые западные модели.
Снижение стоимости связано с более дешёвой инфраструктурой и государственными субсидиями. При этом ускоренное развитие китайских моделей рассматривается как часть стратегической технологической политики, направленной на снижение зависимости от западного оборудования.
Несмотря на сильные результаты в бенчмарках, GLM-5.2 показывает более слабые результаты в задачах, требующих длительного абстрактного мышления. В тестах уровня ARC-AGI-2, ориентированных на новые формы рассуждения, китайские модели всё ещё уступают американским решениям.
Эксперты отмечают, что разрыв между «прикладной» и «глубокой» интеллектуальной эффективностью остаётся ключевой проблемой современных моделей.
Одним из ключевых преимуществ GLM-5.2 является открытая публикация весов. Модель распространяется без региональных ограничений и может быть развернута локально, однако для этого требуется инфраструктура уровня дата-центра — около 1,5 ТБ GPU-памяти.
При этом облачный API создаёт отдельные риски. Компания Z.ai зарегистрирована в Китае и подпадает под действие местного законодательства, включая закон о национальной разведке и законы о кибербезопасности и данных, которые предполагают возможный доступ государственных органов к инфраструктуре.
В 2025 году Бюро промышленной безопасности США внесло Z.ai в санкционные списки, сославшись на возможное участие компании в развитии военных технологий. В 2026 году Конгресс США начал дополнительное расследование рисков, связанных с использованием китайских ИИ-моделей в критической инфраструктуре.
С 2022 года США последовательно ужесточают экспортный контроль в отношении ИИ-чипов и технологий. Однако появление GLM-5.2, обученной на десятках тысяч ускорителей Huawei, показывает, что китайская индустрия продолжает развиваться даже в условиях ограничений.
GLM-5.2 стала примером того, что технологическое давление и санкции не всегда приводят к замедлению развития, а иногда стимулируют создание альтернативных экосистем. Модель демонстрирует высокий уровень в прикладных задачах и приближает китайские разработки к западным аналогам.
При этом в наиболее сложных сценариях рассуждения и долгосрочного планирования США сохраняют преимущество, а реальная конкуренция смещается в сторону качества архитектурных решений и эффективности вычислений, а не только доступности оборудования.