WebGPTWebGPT

Короткий ответ

IBM Research открыла CUGA — фреймворк для AI-агентов с 24 готовыми приложениями. Что умеет лёгкий харнесс и как опробовать модели в России и СНГ.

О чём эта статья?

Статья объясняет тему IBM открыла CUGA: 24 готовых примера AI-агентов на лёгком фреймворке и помогает быстро понять, стоит ли использовать этот сценарий, сервис или подход на практике.

Кому полезен этот материал?

Пользователям WebGPT, маркетологам, авторам и специалистам, которые выбирают инструменты AI и хотят сравнить решения по одной задаче.

Новости

IBM открыла CUGA: 24 готовых примера AI-агентов на лёгком фреймворке

23 июня 2026 г.8 мин чтения

IBM Research открыла CUGA — фреймворк для AI-агентов с 24 готовыми приложениями. Что умеет лёгкий харнесс и как опробовать модели в России и СНГ.

IBM Research выложила в открытый доступ CUGA — фреймворк для создания AI-агентов вместе с библиотекой из 24 рабочих приложений-примеров на лёгком «харнессе» (управляющем слое). Это означает, что построить полноценного агента — с планированием, памятью, вызовом инструментов и защитными политиками — теперь можно за десятки строк кода, а не недели инфраструктурной возни. Для разработчиков и продуктовых команд в России и СНГ, которые экспериментируют с автономными ИИ-помощниками, это редкий пример полностью открытого, готового к копированию кода. В этой статье разбираем, что именно выпустила IBM, почему это важно и как опробовать подобные модели уже сейчас.

CUGA автоматизирует «сантехнику» агентов — оркестрацию инструментов, состояние и защиту, оставляя разработчику только логику задачи.

Что произошло?

IBM Research опубликовала CUGA (Configurable Generalist Agent) — открытый управляющий слой для агентных приложений. Главная идея проста: построение агента — это в основном «сантехника», то есть рутинное соединение модели, адаптеров инструментов, управления состоянием и потоковой выдачи. CUGA берёт эту рутину на себя, а разработчик описывает только то, что уникально для его задачи: набор инструментов и промпты.

Вместе с фреймворком вышла коллекция cuga-apps — два десятка приложений на FastAPI, каждое из которых умещается в один файл. Среди них рекомендатель фильмов, советник по архитектуре IBM Cloud, семиагентная система генерации лидов под названием Ouroboros и инструменты автоматизации браузера.

«Создание агента — это в основном сантехника: инструменты, состояние, защитные ограничения, масштабирование от одного агента ко многим», — формулирует философию проекта оригинальная публикация IBM Research в блоге Hugging Face.

Каждое приложение задумано так, чтобы его можно было прочитать целиком от начала до конца и склонировать как стартовый шаблон. Примеры сгруппированы в семейства:

  • Исследовательские инструменты — ранжирование научных статей, синтез с цитатами;
  • Продуктивность — помощники для повседневных рабочих задач;
  • Обработка документов и медиа — приложения с RAG (поиск по своим данным);
  • Корпоративные операции — примеры для бизнес-сценариев.

Что такое «лёгкий харнесс» и что он умеет?

Харнесс (harness) — это управляющая обвязка, которая даёт агенту базовую «механику» поведения. Обычно команды переписывают её заново в каждом проекте. CUGA предлагает её из коробки, и именно это превращает разрозненные вызовы LLM в связного автономного помощника.

В состав харнесса входят несколько ключевых компонентов:

  1. Планирование и исполнение с отслеживанием переменных вдоль длинных цепочек задач;
  2. Шаги рефлексии, которые ловят ошибки планирования и откатываются назад, вместо того чтобы упрямо двигаться дальше;
  3. Управление состоянием, сохраняющее промежуточные результаты;
  4. Исполнение кода в настраиваемых песочницах — локально, в Docker или в облаке E2B;
  5. Баланс «стоимость/скорость» в виде трёх режимов — Fast, Balanced и Accurate — как настройка, а не как код.
Полное определение агента в CUGA требует всего четырёх аргументов конструктора и около 30 строк кода.

Особое внимание уделено принципу «безопасность по умолчанию». В CUGA встроена система политик с шестью типами правил: Intent Guards (проверка намерений), Tool Approval (подтверждение вызова инструмента), Tool Guides, Playbooks, Output Formatters и пользовательские политики. По данным публикации IBM Research, эти политики прикрепляются к тому же объекту агента, а не «прикручиваются» постфактум, поэтому «управляемый путь — это путь по умолчанию, а неуправляемые шорткаты приходится включать осознанно».

Почему это важно для пользователей ИИ?

Главная ценность CUGA — не в одном конкретном приложении, а в том, что он снижает порог входа в разработку агентов. Раньше, чтобы собрать рабочего автономного помощника, команда тратила недели на инфраструктуру. Теперь базовая обвязка готова, и фокус смещается на содержательную часть — какие задачи агент решает и как.

Ещё одна важная черта — модельная независимость. Одна переменная окружения переключает CUGA между OpenAI, Anthropic, watsonx, Ollama и другими провайдерами без единой правки кода. Это значит, что приложение, написанное под одну модель, легко перенести на другую — например, если доступ к конкретному API меняется.

Для пользователей в России и СНГ модельная независимость особенно ценна: доступ к зарубежным API нестабилен, и возможность переключить агента на локальную модель через Ollama или на другого провайдера одной строкой — реальное преимущество, а не маркетинговый лозунг.

CUGA умеет смешивать инструменты разных типов в едином интерфейсе:

  • встроенные функции на Python;
  • серверы по протоколу MCP (Model Context Protocol);
  • инструменты LangChain.

Если вы хотите сначала просто почувствовать, как ведут себя современные модели в роли «агента» — отвечают, рассуждают, обращаются к данным, — это удобно сделать без настройки инфраструктуры. В WebGPT уже доступны ChatGPT, Claude, Gemini и DeepSeek, и через ask.gptweb.ru можно протестировать те же модели, на которых строятся агенты вроде CUGA, прежде чем разворачивать собственный код.

Насколько CUGA силён по сравнению с другими?

IBM подкрепляет анонс конкретными цифрами. По данным блога IBM Research на платформе Hugging Face, агент CUGA занимает первое место в бенчмарке AppWorld (с июля 2025 по февраль 2026) и был лидером WebArena (с февраля по сентябрь 2025). Это два авторитетных теста, измеряющих способность агента выполнять реальные задачи в приложениях и в вебе.

Отдельно стоит отметить экономику. CUGA в демонстрациях работает не на дорогих frontier-API, а на открытой модели gpt-oss-120b. Это сигнал в пользу того, что качественного агента можно построить и на моделях с открытыми весами, не привязываясь к закрытым облакам.

CUGA лидировал в бенчмарках AppWorld и WebArena, работая на открытой модели вместо дорогих frontier-API.

Экосистема инструментов тоже немаленькая: проект предоставляет 7 публичных MCP-серверов, на которых размещены 36 переиспользуемых инструментов. Для многоагентных сценариев предусмотрена композиция: супервайзеры делегируют задачи специализированным агентам с изолированными контекстами или обращаются к внешним агентам по протоколу A2A (Agent-to-Agent).

Как устроен типичный пример

Наглядный кейс — советник по IBM Cloud. Он ищет реальный каталог сервисов через API (встроенный инструмент) и пользуется веб-поиском с MCP-сервера (общий инструмент), а правило «сначала каталог, потом рекомендация» зашито в промпт. Всё определение агента — четыре аргумента конструктора и около 30 строк кода.

Для продакшена тот же код агента разворачивается без изменений в IBM Sovereign Core, где данные, плоскость управления и исполнение остаются в границах организации. Как формулирует IBM, «вы не портируете его — вы его передеплоиваете».

Как это повлияет на разработчиков в России и СНГ?

Открытость — ключевой момент. CUGA можно склонировать, запустить локально (pip install cuga, переменные окружения под своего LLM-провайдера, затем docker compose up) и изучить «живые» приложения, а не абстрактные туториалы. Для команд, которым важно держать данные внутри собственного контура, возможность гонять агента на локальной модели через Ollama снимает значительную часть рисков.

Что это меняет на практике:

  • Ниже порог входа — не нужно изобретать управление состоянием и политики безопасности с нуля;
  • Гибкость по моделям — переключение провайдера одной переменной защищает от перебоев с доступом;
  • Прозрачность — каждый пример читается целиком, что упрощает обучение и аудит;
  • Самообучение — интеграция с ALTK-Evolve позволяет агенту улучшать навыки на основе собственных запусков.

Если вы только начинаете и хотите понять, на что способны современные модели в режиме рассуждения и работы с инструментами, разумнее сначала поработать с готовым чатом. Подробнее о том, как разные модели справляются с задачами, мы писали в материале сравнение AI-моделей для практических задач.

Что делать прямо сейчас?

Если вы разработчик — стоит склонировать репозиторий cuga-apps, выбрать пример, ближайший к вашей задаче (рекомендатель, RAG-обработка документов, многоагентная система), и пройти его от начала до конца. Это быстрее, чем строить обвязку самостоятельно.

Если вы пользователь, который просто хочет идти в ногу с трендом агентных ИИ, — начните с практики работы с самими моделями. Через WebGPT можно протестировать ChatGPT, Claude и Gemini на реальных задачах: попросить разложить проект на шаги, написать код инструмента, проверить логику промпта. Это та же «сырьевая» сила, которую CUGA лишь оркеструет. О ближайших новинках в мире ИИ мы рассказываем в разделе главные новости искусственного интеллекта.

Открытые фреймворки вроде CUGA снижают порог входа в разработку агентов для команд в России и СНГ.

Главный вывод прост: индустрия движется от «чатов» к «агентам» — системам, которые не просто отвечают, а планируют, проверяют себя и выполняют задачи. CUGA — заметный шаг к тому, чтобы такие системы могла собирать не только крупная корпорация, но и небольшая команда или один разработчик.

Часто задаваемые вопросы

Что такое CUGA простыми словами?

CUGA (Configurable Generalist Agent) — это открытый фреймворк от IBM Research для создания AI-агентов. Он берёт на себя рутинную «сантехнику» — управление инструментами, памятью, защитными политиками — чтобы разработчик описывал только логику своей задачи. Вместе с ним вышли 24 готовых приложения-примера.

Чем агент отличается от обычного чат-бота?

Чат-бот отвечает на сообщения, а агент выполняет многошаговые задачи: планирует действия, вызывает инструменты и API, проверяет промежуточные результаты и при ошибке откатывается назад. CUGA как раз даёт эту «механику» автономного поведения из коробки.

На каких моделях работает CUGA?

CUGA модельно независим: одна переменная окружения переключает его между OpenAI, Anthropic, watsonx, Ollama и другими провайдерами без правки кода. В демонстрациях IBM использует открытую модель gpt-oss-120b, что показывает работоспособность и без дорогих закрытых API.

Можно ли попробовать подобные модели без настройки кода?

Да. Прежде чем разворачивать собственного агента, удобно поработать с базовыми моделями напрямую. Через WebGPT (ask.gptweb.ru) доступны ChatGPT, Claude, Gemini и DeepSeek — те же движки, на которых строятся агентные системы вроде CUGA.

Безопасно ли использовать открытые фреймворки для агентов?

CUGA построен по принципу «безопасность по умолчанию»: в нём встроены шесть типов политик (проверка намерений, подтверждение вызова инструментов и другие), а управляемый путь является путём по умолчанию. Для команд, которым важна изоляция данных, предусмотрен запуск на локальных моделях и развёртывание в собственном контуре.

Попробуйте WebGPT бесплатно

Более 100 нейросетей в одном окне — ChatGPT, Claude, Gemini и другие. Без VPN и зарубежных карт.

Промокод:

100 бонусных токенов на 30 дн.

Начать бесплатно

Читайте также

Новости
Новости22 июня 2026 г.

PP-OCRv6 на Hugging Face: OCR на 50 языков от 1,5 до 34,5 млн параметров

PaddlePaddle выложила на Hugging Face PP-OCRv6 — линейку лёгких OCR-моделей с поддержкой 50 языков и размером от 1,5 до 34,5 млн параметров. Разбираем, что это даёт пользователям AI-инструментов в России и СНГ.

9 мин чтения
Новости
Новости20 июня 2026 г.

Бум курсов по ИИ и нейросетям в 2026: где учиться с нуля и бесплатно

Разбираем волну новых курсов по искусственному интеллекту: где обучение нейросетям доступно бесплатно, сколько стоят программы с нуля и как новичку начать работать с ИИ уже сегодня.

12 мин чтения

Последние статьи

Для бизнеса
Для бизнеса23 июня 2026 г.

Gemine (Gemini) для бизнеса в 2026: как нейросеть Google повышает продажи, маркетинг и HR — с расчётом ROI

Разбираем, что такое Gemine (Gemini) от Google, почему её ищут с ошибками, как подключить нейросеть в России и где она реально окупается в продажах, маркетинге и HR.

11 мин чтения
Гайды
Гайды23 июня 2026 г.

Чат GPT: главные новости — пошаговый гайд 2026, как настроить отслеживание и не попасться на фейки

Практическое руководство 2026 года: как построить личную систему отслеживания главных новостей про чат GPT, где брать первоисточники, как проверять факты и какие промпты использовать для анализа.

9 мин чтения
Кейсы
Кейсы23 июня 2026 г.

Чат GPT: ключевые события последних дней — 9 реальных кейсов, как новые обновления работают на практике

Разбираем ключевые события последних дней вокруг чат GPT и показываем на 9 реальных кейсах, как свежие обновления экономят часы работы — с цифрами, промптами и инструментами.

11 мин чтения