IBM Research выложила в открытый доступ CUGA — фреймворк для создания AI-агентов вместе с библиотекой из 24 рабочих приложений-примеров на лёгком «харнессе» (управляющем слое). Это означает, что построить полноценного агента — с планированием, памятью, вызовом инструментов и защитными политиками — теперь можно за десятки строк кода, а не недели инфраструктурной возни. Для разработчиков и продуктовых команд в России и СНГ, которые экспериментируют с автономными ИИ-помощниками, это редкий пример полностью открытого, готового к копированию кода. В этой статье разбираем, что именно выпустила IBM, почему это важно и как опробовать подобные модели уже сейчас.
Что произошло?
IBM Research опубликовала CUGA (Configurable Generalist Agent) — открытый управляющий слой для агентных приложений. Главная идея проста: построение агента — это в основном «сантехника», то есть рутинное соединение модели, адаптеров инструментов, управления состоянием и потоковой выдачи. CUGA берёт эту рутину на себя, а разработчик описывает только то, что уникально для его задачи: набор инструментов и промпты.
Вместе с фреймворком вышла коллекция cuga-apps — два десятка приложений на FastAPI, каждое из которых умещается в один файл. Среди них рекомендатель фильмов, советник по архитектуре IBM Cloud, семиагентная система генерации лидов под названием Ouroboros и инструменты автоматизации браузера.
«Создание агента — это в основном сантехника: инструменты, состояние, защитные ограничения, масштабирование от одного агента ко многим», — формулирует философию проекта оригинальная публикация IBM Research в блоге Hugging Face.
Каждое приложение задумано так, чтобы его можно было прочитать целиком от начала до конца и склонировать как стартовый шаблон. Примеры сгруппированы в семейства:
- Исследовательские инструменты — ранжирование научных статей, синтез с цитатами;
- Продуктивность — помощники для повседневных рабочих задач;
- Обработка документов и медиа — приложения с RAG (поиск по своим данным);
- Корпоративные операции — примеры для бизнес-сценариев.
Что такое «лёгкий харнесс» и что он умеет?
Харнесс (harness) — это управляющая обвязка, которая даёт агенту базовую «механику» поведения. Обычно команды переписывают её заново в каждом проекте. CUGA предлагает её из коробки, и именно это превращает разрозненные вызовы LLM в связного автономного помощника.
В состав харнесса входят несколько ключевых компонентов:
- Планирование и исполнение с отслеживанием переменных вдоль длинных цепочек задач;
- Шаги рефлексии, которые ловят ошибки планирования и откатываются назад, вместо того чтобы упрямо двигаться дальше;
- Управление состоянием, сохраняющее промежуточные результаты;
- Исполнение кода в настраиваемых песочницах — локально, в Docker или в облаке E2B;
- Баланс «стоимость/скорость» в виде трёх режимов — Fast, Balanced и Accurate — как настройка, а не как код.
Особое внимание уделено принципу «безопасность по умолчанию». В CUGA встроена система политик с шестью типами правил: Intent Guards (проверка намерений), Tool Approval (подтверждение вызова инструмента), Tool Guides, Playbooks, Output Formatters и пользовательские политики. По данным публикации IBM Research, эти политики прикрепляются к тому же объекту агента, а не «прикручиваются» постфактум, поэтому «управляемый путь — это путь по умолчанию, а неуправляемые шорткаты приходится включать осознанно».
Почему это важно для пользователей ИИ?
Главная ценность CUGA — не в одном конкретном приложении, а в том, что он снижает порог входа в разработку агентов. Раньше, чтобы собрать рабочего автономного помощника, команда тратила недели на инфраструктуру. Теперь базовая обвязка готова, и фокус смещается на содержательную часть — какие задачи агент решает и как.
Ещё одна важная черта — модельная независимость. Одна переменная окружения переключает CUGA между OpenAI, Anthropic, watsonx, Ollama и другими провайдерами без единой правки кода. Это значит, что приложение, написанное под одну модель, легко перенести на другую — например, если доступ к конкретному API меняется.
Для пользователей в России и СНГ модельная независимость особенно ценна: доступ к зарубежным API нестабилен, и возможность переключить агента на локальную модель через Ollama или на другого провайдера одной строкой — реальное преимущество, а не маркетинговый лозунг.
CUGA умеет смешивать инструменты разных типов в едином интерфейсе:
- встроенные функции на Python;
- серверы по протоколу MCP (Model Context Protocol);
- инструменты LangChain.
Если вы хотите сначала просто почувствовать, как ведут себя современные модели в роли «агента» — отвечают, рассуждают, обращаются к данным, — это удобно сделать без настройки инфраструктуры. В WebGPT уже доступны ChatGPT, Claude, Gemini и DeepSeek, и через ask.gptweb.ru можно протестировать те же модели, на которых строятся агенты вроде CUGA, прежде чем разворачивать собственный код.
Насколько CUGA силён по сравнению с другими?
IBM подкрепляет анонс конкретными цифрами. По данным блога IBM Research на платформе Hugging Face, агент CUGA занимает первое место в бенчмарке AppWorld (с июля 2025 по февраль 2026) и был лидером WebArena (с февраля по сентябрь 2025). Это два авторитетных теста, измеряющих способность агента выполнять реальные задачи в приложениях и в вебе.
Отдельно стоит отметить экономику. CUGA в демонстрациях работает не на дорогих frontier-API, а на открытой модели gpt-oss-120b. Это сигнал в пользу того, что качественного агента можно построить и на моделях с открытыми весами, не привязываясь к закрытым облакам.
Экосистема инструментов тоже немаленькая: проект предоставляет 7 публичных MCP-серверов, на которых размещены 36 переиспользуемых инструментов. Для многоагентных сценариев предусмотрена композиция: супервайзеры делегируют задачи специализированным агентам с изолированными контекстами или обращаются к внешним агентам по протоколу A2A (Agent-to-Agent).
Как устроен типичный пример
Наглядный кейс — советник по IBM Cloud. Он ищет реальный каталог сервисов через API (встроенный инструмент) и пользуется веб-поиском с MCP-сервера (общий инструмент), а правило «сначала каталог, потом рекомендация» зашито в промпт. Всё определение агента — четыре аргумента конструктора и около 30 строк кода.
Для продакшена тот же код агента разворачивается без изменений в IBM Sovereign Core, где данные, плоскость управления и исполнение остаются в границах организации. Как формулирует IBM, «вы не портируете его — вы его передеплоиваете».
Как это повлияет на разработчиков в России и СНГ?
Открытость — ключевой момент. CUGA можно склонировать, запустить локально (pip install cuga, переменные окружения под своего LLM-провайдера, затем docker compose up) и изучить «живые» приложения, а не абстрактные туториалы. Для команд, которым важно держать данные внутри собственного контура, возможность гонять агента на локальной модели через Ollama снимает значительную часть рисков.
Что это меняет на практике:
- Ниже порог входа — не нужно изобретать управление состоянием и политики безопасности с нуля;
- Гибкость по моделям — переключение провайдера одной переменной защищает от перебоев с доступом;
- Прозрачность — каждый пример читается целиком, что упрощает обучение и аудит;
- Самообучение — интеграция с ALTK-Evolve позволяет агенту улучшать навыки на основе собственных запусков.
Если вы только начинаете и хотите понять, на что способны современные модели в режиме рассуждения и работы с инструментами, разумнее сначала поработать с готовым чатом. Подробнее о том, как разные модели справляются с задачами, мы писали в материале сравнение AI-моделей для практических задач.
Что делать прямо сейчас?
Если вы разработчик — стоит склонировать репозиторий cuga-apps, выбрать пример, ближайший к вашей задаче (рекомендатель, RAG-обработка документов, многоагентная система), и пройти его от начала до конца. Это быстрее, чем строить обвязку самостоятельно.
Если вы пользователь, который просто хочет идти в ногу с трендом агентных ИИ, — начните с практики работы с самими моделями. Через WebGPT можно протестировать ChatGPT, Claude и Gemini на реальных задачах: попросить разложить проект на шаги, написать код инструмента, проверить логику промпта. Это та же «сырьевая» сила, которую CUGA лишь оркеструет. О ближайших новинках в мире ИИ мы рассказываем в разделе главные новости искусственного интеллекта.
Главный вывод прост: индустрия движется от «чатов» к «агентам» — системам, которые не просто отвечают, а планируют, проверяют себя и выполняют задачи. CUGA — заметный шаг к тому, чтобы такие системы могла собирать не только крупная корпорация, но и небольшая команда или один разработчик.
Часто задаваемые вопросы
Что такое CUGA простыми словами?
CUGA (Configurable Generalist Agent) — это открытый фреймворк от IBM Research для создания AI-агентов. Он берёт на себя рутинную «сантехнику» — управление инструментами, памятью, защитными политиками — чтобы разработчик описывал только логику своей задачи. Вместе с ним вышли 24 готовых приложения-примера.
Чем агент отличается от обычного чат-бота?
Чат-бот отвечает на сообщения, а агент выполняет многошаговые задачи: планирует действия, вызывает инструменты и API, проверяет промежуточные результаты и при ошибке откатывается назад. CUGA как раз даёт эту «механику» автономного поведения из коробки.
На каких моделях работает CUGA?
CUGA модельно независим: одна переменная окружения переключает его между OpenAI, Anthropic, watsonx, Ollama и другими провайдерами без правки кода. В демонстрациях IBM использует открытую модель gpt-oss-120b, что показывает работоспособность и без дорогих закрытых API.
Можно ли попробовать подобные модели без настройки кода?
Да. Прежде чем разворачивать собственного агента, удобно поработать с базовыми моделями напрямую. Через WebGPT (ask.gptweb.ru) доступны ChatGPT, Claude, Gemini и DeepSeek — те же движки, на которых строятся агентные системы вроде CUGA.
Безопасно ли использовать открытые фреймворки для агентов?
CUGA построен по принципу «безопасность по умолчанию»: в нём встроены шесть типов политик (проверка намерений, подтверждение вызова инструментов и другие), а управляемый путь является путём по умолчанию. Для команд, которым важна изоляция данных, предусмотрен запуск на локальных моделях и развёртывание в собственном контуре.