Чип NR1 от NeuReality: новый подход к ИИ-инференсу без участия классических CPU
- AlexT
- 17-июн-2025, 11:00
- 0 комментариев
- 9 просмотров
Израильская компания NeuReality представила специализированный чип NR1, который призван заменить традиционные x86-процессоры и сетевые адаптеры при запуске ИИ-моделей. Как утверждает производитель, новинка значительно повышает эффективность инференса, позволяя загружать ИИ-ускорители почти на 100% — тогда как в типичной инфраструктуре уровень загрузки GPU обычно не превышает 30–50%.
NR1 — это не замена GPU, а дополнение к ним: чип берёт на себя управление потоками данных, маршрутизацию запросов и другие задачи, которые обычно обрабатываются центральным процессором и сетевыми интерфейсами. Тем самым устраняются узкие места в инфраструктуре ИИ, ускоряется обработка и снижается энергопотребление.
В тестах одна и та же генеративная модель запускалась на одинаковых ускорителях: при использовании NR1 объём обрабатываемых токенов оказался в 6,5 раза выше, чем в сервере на базе x86 — при тех же энергозатратах и стоимости.
Традиционные CPU разрабатывались под нужды веб-приложений, а не под ресурсоёмкие ИИ-нагрузки. С ростом сложности нейросетей они становятся главным «тормозом» в современных системах. NeuReality предлагает подход, при котором ИИ-ресурсы разделяются: вычисления и хранение работают независимо, что особенно важно для облачных дата-центров и масштабируемых ИИ-систем.
Аппаратный гипервизор и система управления задачами инференса
Поддержка пред- и постобработки данных на аппаратном уровне
Интеграция с Kubernetes и DevOps/MLOps-стеками через SDK
Низкие задержки, линейная масштабируемость и энергосберегающая архитектура
4 декодера для видео и JPEG
16 DSP-модулей для работы с аудио и речью
16 универсальных векторных DSP
Сетевой стек AI-over-Fabric с поддержкой TCP/ROCEv2
Два скоростных порта (10/25/50/100 Гбит/с) с аппаратным шифрованием
Полная поддержка клиент-серверных и сервер-серверных архитектур
Два уровня сетевой изоляции
Чип NR1 ориентирован на различные отрасли — от телекомов и e-commerce до госсектора, страхования, медицины и образования. Его можно применять в задачах генеративного ИИ, компьютерного зрения, голосовых интерфейсов и агентных моделей.
По словам NeuReality, это первый шаг к построению нового класса ИИ-инфраструктуры, в которой больше не нужны дорогие и энергоёмкие CPU.