HuggingFace опубликовал официальный глоссарий ключевых терминов для AI-агентов — словарь, который проясняет разницу между понятиями harness, scaffold, agent, tool и десятками других слов, заполонивших индустрию за последний год. Это означает, что у разработчиков и обычных пользователей AI наконец появилась единая терминологическая база для обсуждения автономных систем — без неё каждый второй спор об агентах превращается в обсуждение разных явлений под одним названием. В этой статье разбираем самые важные термины из глоссария, объясняем, почему они критичны для пользователей AI-сервисов в России и СНГ, и показываем, как новая терминология применяется на практике — в том числе при работе через WebGPT (ask.gptweb.ru).
Что произошло?
26 мая 2026 года команда HuggingFace выпустила публикацию «Harness, Scaffold, and the AI Agent Terms Worth Getting Right» на официальном блоге HuggingFace. Это не очередной обзорный лонгрид, а попытка зафиксировать рабочее определение для каждого термина, который сейчас используется при описании AI-агентов. Авторы прямо констатируют проблему: одно и то же слово в публикациях OpenAI, Anthropic, Google DeepMind и стартапов вроде Cognition означает разные вещи.
До этой публикации индустрия жила в состоянии терминологического хаоса. «AI-агентом» называли:
- обычный чат-бот с подключённым поиском в интернете;
- систему вроде Claude Code или GitHub Copilot Workspace, которая редактирует файлы и запускает команды;
- автономный пайплайн, который сутками решает задачу без вмешательства человека;
- любую модель, которая «вызывает функции» через function calling API.
Каждое из этих определений было справедливо в своём контексте, но при сравнении систем возникал когнитивный диссонанс. Глоссарий HuggingFace эту проблему адресует напрямую, выделяя четыре фундаментальных понятия: model (саму нейросеть), harness (инфраструктурный обвес), scaffold (структурную логику) и agent (комбинацию всего перечисленного, действующую автономно).
Почему правильные термины — это не педантизм?
В разработке программного обеспечения слова имеют вес, особенно когда речь о найме, архитектурных решениях и контрактах. Если ваш заказчик просит «AI-агент для обработки тикетов поддержки», то критично выяснить заранее: он имеет в виду чат-бот с готовыми ответами или автономную систему, которая сама принимает решение о возврате денег? Эти системы отличаются на два порядка по сложности и стоимости.
По данным аналитической части глоссария HuggingFace, более 60% статей, использующих термин «agent», на деле описывают системы без какой-либо реальной автономности — это обычные LLM-приложения с одним-двумя tool calls. При этом инвестиции в «agentic AI» в первом квартале 2026 года, по оценке тех же авторов, превысили 4 миллиарда долларов. Разрыв между ожиданием и реальностью огромный, и одной из причин этого разрыва является именно терминологическая путаница.
Для пользователей в России и СНГ эта тема особенно актуальна. Российские медиа всё чаще пишут об «AI-агентах», но без чёткого разграничения. Когда отечественный сервис анонсирует «агента», часто непонятно — это просто чат-интерфейс над YandexGPT или GigaChat, или действительно автономная система. Понимая глоссарий, можно оценить, насколько маркетинговые заявления соответствуют реальности.
Что такое harness?
Harness — это инфраструктурный слой, который запускает языковую модель в цикле. Дословный перевод — «упряжь», и метафора неслучайна: harness удерживает модель в рабочем цикле и подаёт ей всё необходимое для следующего шага. Конкретно harness отвечает за:
- отправку запросов в API модели (Claude, GPT-4, DeepSeek и т. д.);
- парсинг ответа модели — извлечение из текста структурированных tool calls;
- выполнение вызовов инструментов (например, чтение файла, HTTP-запрос, выполнение SQL);
- передачу результатов обратно модели для следующей итерации;
- обработку ошибок, таймаутов, ретраев;
- контроль контекста, чтобы он не превысил лимиты модели.
HuggingFace подчёркивает, что harness — это, по сути, обычный программный код. Он не содержит интеллекта, но без него модель — просто текстовый генератор. Известные открытые harness'ы — это LangChain Agents, smolagents (разработка самой HuggingFace), а также внутренние реализации Claude Code и Cursor.
Что такое scaffold?
Scaffold — «строительные леса». Это структурированный набор промптов, шаблонов, ролей и правил, который направляет агента в нужное русло. Если harness — это сухая инфраструктура, то scaffold — это интеллектуальная архитектура задачи.
Примеры scaffold:
- паттерн ReAct, где модель чередует «мысль» и «действие»;
- Plan-and-Execute, где сначала строится план, потом выполняется;
- мультиагентные схемы вроде CrewAI или AutoGen, где несколько ролей общаются между собой;
- LangGraph — граф состояний с условными переходами.
Глоссарий настаивает, что scaffold не равен harness: один и тот же harness можно использовать с разными scaffold'ами, и наоборот. Это инверсия контроля, знакомая разработчикам по фреймворкам вроде Spring или Django.
Чем agent отличается от assistant?
Это, пожалуй, самое важное и самое спорное разграничение в глоссарии. HuggingFace формулирует так:
«Agent — это система, которая самостоятельно принимает решения о последовательности действий для достижения цели, заданной человеком. Assistant — это система, которая реагирует на конкретные запросы пользователя, не выходя за их рамки».
Граница тонкая, но содержательная. ChatGPT в обычном режиме — assistant. ChatGPT в режиме Agent Mode, который может ходить по сайтам и выполнять задачи, — это agent. Claude в чате — assistant; Claude Code, который сам редактирует репозиторий и запускает тесты, — agent.
В русскоязычной литературе разделение пока не устоялось, и многие авторы переводят agent как «агент», а assistant — как «ассистент» или «помощник». В WebGPT, например, доступны и assistant-режимы (обычные чат-сессии с моделью), и более агентные сценарии — через подключённые инструменты и кастомные промпты.
Какие ещё термины разбирает глоссарий?
Кроме четвёрки model/harness/scaffold/agent, в публикации HuggingFace формализованы ещё около двадцати понятий. Перечислим самые часто встречающиеся.
- Tool — функция, которую модель может вызвать. Tools — это то, что отличает агента от чистого LLM: возможность взаимодействовать с миром.
- Tool calling / function calling — механизм, через который модель сообщает harness'у, какой инструмент вызвать и с какими аргументами.
- Trajectory — полная последовательность шагов агента: мысль → действие → наблюдение → мысль → … . Trajectory используется для отладки и обучения.
- Memory — состояние, которое агент сохраняет между сессиями. Включает короткую (внутри одной задачи) и длинную (между задачами) память.
- Environment — среда, в которой действует агент: операционная система, браузер, API, песочница.
- Loop — главный цикл harness'а, повторяющий шаги до достижения цели или исчерпания бюджета.
- Budget — лимит ресурсов: количество шагов, токенов, секунд работы.
- Reflection — механизм самопроверки, когда модель оценивает собственный промежуточный результат.
Отдельно глоссарий оговаривает термины из области multi-agent systems: orchestrator (координатор), worker (исполнитель), swarm (рой), handoff (передача задачи между агентами). По данным HuggingFace, такие схемы становятся всё популярнее, но при этом их сложно отлаживать — каждый агент в multi-agent системе должен иметь чёткий контракт.
Почему это важно для пользователей в России и СНГ?
На первый взгляд, глоссарий выглядит как сугубо технический документ для англоязычных разработчиков. Но российский AI-рынок активно перенимает терминологию, и от того, какие переводы и значения закрепятся, зависит понимание индустрии в ближайшие годы.
По нашим наблюдениям, в Рунете уже сейчас расходятся как минимум три варианта перевода: «агентный AI», «AI-агенты», «автономные ассистенты». В крупных компаниях вроде Яндекса и Сбера маркетологи используют слово «агент» как премиальный ярлык — для систем, которые по описанию HuggingFace были бы скорее assistant'ами.
Для разработчиков в России это означает, что при чтении вакансий и техзаданий стоит уточнять: имеется ли в виду agent в строгом смысле HuggingFace или это маркетинговое слово. Аналогично с покупкой инструментов: «агентская платформа» за 50 тысяч рублей в месяц может на деле оказаться обычной LLM-обёрткой.
Для конечных пользователей AI-сервисов глоссарий важен по другой причине — он помогает выбирать. Через WebGPT, например, можно работать с моделями Claude, GPT-4, Gemini и DeepSeek без VPN и без оплаты в долларах. Часть из них поддерживает tool calling и подходит для построения agentic-сценариев, часть лучше использовать в режиме assistant. Понимая разницу, легче выбрать модель под задачу.
Как глоссарий повлияет на разработчиков AI-агентов?
В среднесрочной перспективе можно ожидать четыре эффекта.
Первый — унификация документации крупных провайдеров. OpenAI, Anthropic и Google уже в 2026 году постепенно переходят на более согласованную лексику. Anthropic в обновлённой документации Claude Agent SDK использует термины harness и tool именно в трактовке HuggingFace. OpenAI в Responses API недавно ввёл понятие trajectory.
Второй эффект — упрощение найма. Когда у разработчика на собеседовании спрашивают «расскажи об архитектуре AI-агента», теперь можно ожидать структурированный ответ через модель/harness/scaffold, а не маркетинговую кашу. По данным портала Habr Career, упоминаний «AI Engineer» в вакансиях за последний год выросло на 340%, и работодатели начинают требовать чёткое понимание этих слоёв.
Третий эффект — рост зрелости open source. После публикации HuggingFace ожидается волна обновлений документации в LangChain, LlamaIndex, Haystack, smolagents и других фреймворках. Это упростит переключение между инструментами и снизит порог входа.
Четвёртый, и, возможно, самый важный эффект — рост качества evaluation. Многие бенчмарки до сих пор путают возможности модели и возможности harness'а. Например, если агент справился со SWE-Bench, это заслуга модели, scaffold'а, harness'а или всего вместе? Глоссарий даёт язык для разграничения, и следующие версии бенчмарков, скорее всего, будут оценивать слои по отдельности.
Что делать прямо сейчас?
Если вы разработчик или продакт-менеджер, имеющий дело с AI:
- Прочитайте оригинальную публикацию HuggingFace целиком — она не очень длинная, но плотная. Полезно держать её под рукой при обсуждении архитектуры.
- Пересмотрите свои внутренние документы. Заменяйте размытое «AI-агент» на одно из четырёх: model, harness, scaffold, agent. Это упростит обсуждение.
- В описаниях продуктов и фичах не злоупотребляйте словом agent. Если у вас обычный чат-интерфейс — это assistant, и это не стыдно: 80% реальных продуктов — assistant'ы.
- Если строите agentic-систему — явно зафиксируйте, какой harness вы используете (свой или готовый) и какой scaffold (ReAct, Plan-and-Execute, мультиагентный). Это упростит отладку.
- Для экспериментов с моделями попробуйте разные сценарии — assistant-режим и tool-calling-режим. Через WebGPT можно протестировать, например, Claude Opus и GPT-4o в одном интерфейсе, не настраивая отдельные API-ключи.
Если вы продвинутый пользователь AI, но не разработчик:
- При выборе AI-сервиса смотрите не на маркетинговые слова, а на функциональность. «Может ли система выполнять действия без подтверждения?» — лучше, чем «это агент?».
- Обращайте внимание на то, какая модель стоит под капотом. Один и тот же harness с GPT-4o и с менее мощной моделью даст разные результаты.
- Изучите внутренние ссылки на разборы конкретных архитектур — например, обзор Claude Agent SDK для пользователей в России и материал про LangGraph Server и LangSmith.
Как новая терминология применяется в WebGPT?
WebGPT (ask.gptweb.ru) — это сервис, который даёт доступ к ведущим AI-моделям из России без VPN и без необходимости иметь зарубежную карту. В контексте глоссария HuggingFace WebGPT занимает позицию между «harness» и «assistant-интерфейсом»: пользователь получает чат, плагины, рассылку запросов нескольким моделям и базовые tool-calling сценарии.
Если использовать терминологию глоссария строго, то WebGPT — это, в первую очередь, assistant-платформа. Через WebGPT уже доступны такие модели, как Claude 4.6, GPT-4o, Gemini 2.5 Pro и DeepSeek R1, и каждая из них может работать в режиме обычного помощника или с tool calling, если ваш промпт предусматривает структурированный вывод. Для построения полноценного agent'а в строгом смысле HuggingFace потребуется либо подключить отдельный harness (например, smolagents или LangChain), либо использовать встроенные плагины WebGPT для конкретных задач.
Для русскоязычных пользователей это полезное упрощение: не нужно бояться слова «агент» — большую часть задач решает обычный assistant-режим с правильно сформулированным промптом. А когда задача требует автономии и многошаговости, можно осознанно переходить на agentic-инструменты, понимая, какой слой за что отвечает.
Часто задаваемые вопросы
Где можно прочитать оригинальный глоссарий HuggingFace?
Оригинальная публикация доступна на официальном блоге HuggingFace под заголовком «Harness, Scaffold, and the AI Agent Terms Worth Getting Right». Текст на английском, но в нём активно используются примеры кода и диаграммы, которые понятны без перевода. Для глубокого изучения рекомендуем прочитать его целиком и сохранить ссылку как справочник.
Что важнее — harness или scaffold?
Оба слоя необходимы, и противопоставлять их некорректно. Harness — это «железо» агента, без которого ничего не запустится. Scaffold — это «мозги» агента, без которых harness просто крутит модель вхолостую. На практике начинать удобнее с готового harness'а (например, smolagents) и фокусироваться на проектировании scaffold'а под конкретную задачу.
Какие фреймворки помогают строить AI-агентов в 2026 году?
Среди популярных — LangChain и LangGraph от LangChain Inc., AutoGen от Microsoft Research, CrewAI, smolagents от HuggingFace, а также LlamaIndex для агентов, ориентированных на работу с документами. У каждого свой подход: smolagents делает упор на минималистичность, CrewAI — на ролевые мультиагентные схемы, LangGraph — на явные графы состояний. Выбор зависит от задачи и предпочтений команды.
Можно ли использовать AI-агентов в WebGPT?
В WebGPT доступны все ведущие модели — Claude 4.6, GPT-4o, Gemini, DeepSeek — и их можно использовать в режимах, близких к agentic. Полноценный автономный agent с собственным harness'ом нужно строить отдельно, но WebGPT удобно использовать как песочницу для тестирования промптов, scaffold-паттернов и tool-calling сценариев — без необходимости настраивать API-ключи каждой модели по отдельности.
Будет ли глоссарий обновляться?
По заявлению авторов из HuggingFace, область AI-агентов развивается слишком быстро, чтобы зафиксировать терминологию навсегда. В публикации указано, что глоссарий будет регулярно обновляться, и сообщество может предлагать правки через GitHub. Скорее всего, в ближайший год добавятся термины из области multi-agent systems, RL-based агентов и continuous learning. Стоит подписаться на блог HuggingFace или отслеживать обновления через RSS.