Nous Research представила Hermes 4 — открытую языковую модель без цензуры и с рекордной скоростью работы » У айтишки - Новости кино, игр, IT, интернета

Nous Research представила Hermes 4 — открытую языковую модель без цензуры и с рекордной скоростью работы

AlexT
01-сен-2025, 10:00
0 комментариев
141 просмотров

Стартап в сфере искусственного интеллекта Nous Research представил семейство больших языковых моделей Hermes 4, позиционируя его как альтернативу закрытым решениям от OpenAI, Google и Anthropic. Разработчики утверждают, что новые модели способны конкурировать с ведущими системами, предоставляя пользователю практически полный контроль над ИИ и минимальное количество встроенных ограничений.

Ключевые особенности Hermes 4

Hermes 4 построена на принципе гибридных рассуждений: пользователь может выбирать между быстрыми ответами и глубоким пошаговым анализом. В отличие от коммерческих моделей, где цепочка рассуждений скрыта, Hermes 4 демонстрирует её открыто в тегах <think>, обеспечивая прозрачность.

Семейство включает несколько версий, крупнейшая из которых насчитывает 405 млрд параметров. По результатам тестирования:

В MATH-500 модель показала 96,3 %.
В математическом бенчмарке AIME’24 результат составил 81,9 %.
В тесте RefusalBench, измеряющем частоту отказа отвечать на запросы, Hermes 4 набрала 57,1 %, тогда как GPT-4o и Claude Sonnet 4 — около 17 %.

Новые технологии обучения

При разработке Hermes 4 были применены два новых инструмента:

DataForge — генератор синтетических данных на основе графов. Он преобразует простые исходные материалы в сложные задания: например, превращает статью из «Википедии» в рэп-текст и затем генерирует к нему вопросы и ответы.
Atropos — система обучения с подкреплением. Она моделирует сотни виртуальных сред, в которых ИИ тренируется в математике, программировании, работе с инструментами и креативных задачах.

В обучении использовалось 3,5 млн примеров с рассуждениями и 1,6 млн — без рассуждений. Для этого задействовали 192 ускорителя Nvidia B200, потребовавшие в сумме 71 616 GPU-часов (около 15,5 суток непрерывных вычислений).

Решение проблемы "бесконечных рассуждений"

Одним из технических вызовов стала чрезмерная длина логических цепочек. Младшая модель Hermes 4 (14 млрд параметров) в 60 % случаев достигала лимита контекста и попадала в бесконечные циклы. Решением стало ограничение на 30 000 токенов, что позволило сократить число таких ошибок на 65–79 % при сохранении качества ответов.

Ограничения и доступность

Несмотря на впечатляющие результаты, Hermes 4 остаётся требовательной к вычислительным ресурсам, а её использование сложнее по сравнению с коммерческими аналогами. При этом:

веса моделей можно бесплатно загрузить на Hugging Face;
доступен API через чат-интерфейс;
поддержку обеспечивают компании Chutes, Nebius и Luminal, специализирующиеся на внедрении ИИ.

Значение для рынка ИИ

Hermes 4 стала вызовом для крупных игроков: модель сочетает высокую производительность с отсутствием цензуры и полной прозрачностью работы. Nous Research делает ставку на свободу пользователя, противопоставляя её корпоративным ограничениям OpenAI и Google.

Вывод: Hermes 4 может стать заметной альтернативой закрытым системам, а открытая политика Nous Research способна привлечь разработчиков, исследователей и энтузиастов, ищущих гибкость и контроль над искусственным интеллектом.