Перейти к содержанию

Overview

На этой странице

Hermes Agent включает богатый набор возможностей, выходящих далеко за рамки простого общения. От постоянной памяти и контекста, учитывающего файлы, до автоматизации браузера и голосовых разговоров — эти функции работают вместе, делая Hermes мощным автономным ассистентом.

Core

  • Инструменты и наборы инструментов — Инструменты — это функции, расширяющие возможности агента. Они организованы в логические наборы, которые можно включать или отключать для каждой платформы, охватывая веб-поиск, выполнение команд в терминале, редактирование файлов, память, делегирование и многое другое.
  • Система навыков — Документы знаний, загружаемые агентом по запросу. Навыки следуют шаблону прогрессивного раскрытия для минимизации использования токенов и совместимы с открытым стандартом agentskills.io.
  • Постоянная память — Ограниченная, курируемая память, сохраняющаяся между сеансами. Hermes запоминает ваши предпочтения, проекты, окружение и изученную информацию через MEMORY.md и USER.md.
  • Контекстные файлы — Hermes автоматически обнаруживает и загружает контекстные файлы проекта (.hermes.md, AGENTS.md, CLAUDE.md, SOUL.md, .cursorrules), которые определяют его поведение в вашем проекте.
  • Контекстные ссылки — Введите @ с последующей ссылкой, чтобы вставить файлы, папки, git-дифы и URL-адреса прямо в ваши сообщения. Hermes разворачивает ссылку и автоматически добавляет содержимое.
  • Контрольные точки — Hermes автоматически создаёт снимки вашей рабочей директории перед внесением изменений в файлы, предоставляя страховочную сетку для отката с помощью /rollback в случае проблем.

Automation

  • Планирование задач (Cron) — Планируйте автоматическое выполнение задач с помощью естественного языка или cron-выражений. Задачи могут подключать навыки, доставлять результаты на любую платформу и поддерживают операции паузы/возобновления/редактирования.
  • Делегирование субагентам — Инструмент delegate_task порождает дочерние экземпляры агента с изолированным контекстом, ограниченными наборами инструментов и собственными сеансами терминала. По умолчанию до 3 одновременных субагентов (настраивается) для параллельных рабочих потоков.
  • Выполнение кода — Инструмент execute_code позволяет агенту писать Python-скрипты, которые программно вызывают инструменты Hermes, сворачивая многошаговые рабочие процессы в один виток LLM через изолированное RPC-выполнение.
  • Событийные хуки — Запускайте пользовательский код в ключевых точках жизненного цикла. Шлюзовые хуки обрабатывают логирование, оповещения и вебхуки; хуки плагинов — перехват инструментов, метрики и защитные механизмы.
  • Пакетная обработка — Запускайте агента Hermes на сотнях или тысячах промптов параллельно, генерируя структурированные траекторные данные в формате ShareGPT для генерации обучающих данных или оценки.

Media & Web

  • Голосовой режим — Полноценное голосовое взаимодействие на CLI и в мессенджерах. Общайтесь с агентом через микрофон, слушайте голосовые ответы и ведите живые голосовые разговоры в голосовых каналах Discord.
  • Автоматизация браузера — Полноценная автоматизация браузера с несколькими бэкендами: Browserbase cloud, Browser Use cloud, локальный Chrome через CDP или локальный Chromium. Навигация по сайтам, заполнение форм и извлечение информации.
  • Зрение и вставка изображений — Мультимодальная поддержка зрения. Вставляйте изображения из буфера обмена в CLI и просите агента проанализировать, описать или обработать их с помощью любой модели, поддерживающей зрение.
  • Генерация изображений — Генерируйте изображения по текстовым описаниям с помощью FAL.ai. Поддерживается девять моделей (FLUX 2 Klein/Pro, GPT-Image 1.5/2, Nano Banana Pro, Ideogram V3, Recraft V4 Pro, Qwen, Z-Image Turbo); выберите через hermes tools.
  • Озвучивание и TTS — Синтез речи и транскрипция голосовых сообщений на всех платформах обмена сообщениями, с десятью встроенными провайдерами: Edge TTS (бесплатно), ElevenLabs, OpenAI TTS, MiniMax, Mistral Voxtral, Google Gemini, xAI, NeuTTS, KittenTTS и Piper — плюс пользовательские командные провайдеры для любого локального TTS CLI.

Integrations

  • Интеграция MCP — Подключайтесь к любому MCP-серверу через stdio или HTTP-транспорт. Получайте доступ к внешним инструментам из GitHub, баз данных, файловых систем и внутренних API без написания нативных инструментов Hermes. Включает фильтрацию инструментов для каждого сервера и поддержку сэмплирования.
  • Маршрутизация провайдеров — Тонкий контроль над тем, какие AI-провайдеры обрабатывают ваши запросы. Оптимизируйте по стоимости, скорости или качеству с помощью сортировки, белых списков, чёрных списков и приоритетного упорядочивания.
  • Резервные провайдеры — Автоматическое переключение на запасных LLM-провайдеров при ошибках основной модели, включая независимый резерв для вспомогательных задач, таких как зрение и сжатие.
  • Пулы учётных данных — Распределение API-вызовов между несколькими ключами одного провайдера. Автоматическая ротация при превышении лимитов или сбоях.
  • Провайдеры памяти — Подключайте внешние бэкенды памяти (Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory) для кросс-сессионного моделирования пользователей и персонализации помимо встроенной системы памяти.
  • API-сервер — Предоставьте Hermes как HTTP-эндпоинт, совместимый с OpenAI. Подключайте любой фронтенд, говорящий на формате OpenAI — Open WebUI, LobeChat, LibreChat и другие.
  • Интеграция с IDE (ACP) — Используйте Hermes внутри ACP-совместимых редакторов, таких как VS Code, Zed и JetBrains. Чат, активность инструментов, файловые дифы и команды терминала отображаются внутри редактора.
  • RL-обучение — Генерируйте траекторные данные из сеансов агента для обучения с подкреплением и тонкой настройки моделей.

Customization

  • Личность и SOUL.md — Полностью настраиваемая личность агента. SOUL.md — основной файл идентичности, первое в системном промпте; вы можете переключать встроенные или пользовательские пресеты /personality для каждого сеанса.
  • Скины и темы — Настраивайте визуальное представление CLI: цвета баннера, лица и глаголы спиннера, метки блоков ответов, брендовый текст и префикс активности инструментов.
  • Плагины — Добавляйте пользовательские инструменты, хуки и интеграции без изменения основного кода. Три типа плагинов: общие (инструменты/хуки), провайдеры памяти (кросс-сессионные знания) и контекстные движки (альтернативное управление контекстом). Управляются через единый интерактивный интерфейс hermes plugins.

  • Core

  • Automation
  • Media & Web
  • Integrations
  • Customization