Optimizer Agent documentation review

Context Compression and Caching

Side #9 · Kilde: https://hermes-agent.nousresearch.com/docs/developer-guide/context-compression-and-caching

Context Compression and Caching

Finding

Denne side er vigtig, fordi Hermes+n8n+LangGraph-operativsystemet kun bliver stabilt i lange arbejdsgange, hvis kontekst, komprimering og caching håndteres bevidst.

What it is

Siden beskriver Hermes’ to lag for kontekstkomprimering: agentens normale ContextCompressor og gatewayens ekstra sikkerhedsnet mod for store sessions. Den forklarer også, hvordan prompt caching kan reducere tokenomkostninger for Claude/Anthropic-kompatible modeller. Det vigtigste driftsmæssige punkt er, at komprimeringsmodellen skal kunne håndtere mindst samme kontekstlængde som hovedmodellen, ellers kan vigtig mellem-kontekst gå tabt.

Should we use it?

Use now. Lisa bør bruge standardkomprimering aktivt, fordi missionen involverer lange research-, arkitektur- og agentforløb på tværs af Hermes, n8n og LangGraph. Vi bør ikke overbygge et eget memory-/compression-lag, før Hermes’ native komprimering, skills, Honcho og artifacts er brugt korrekt. Prompt caching er især relevant, hvis der køres Claude via Anthropic/OpenRouter; ellers skal siden primært bruges som driftsregel for kontekstpres og aux-modelvalg.

Recommendation

Sørg for, at `compression.enabled` forbliver aktiv, og at auxiliary compression-model/provider ikke har mindre kontekstvindue end hovedmodellen; ellers skal lange missioner flyttes til skills, wiki/artifacts eller session-resume i stedet for at stole på komprimering alene.

Use now

Lange Hermes-sessioner med research, debugging, arkitektur og dokumentationsarbejde.
Telegram/gateway-sessions, hvor samtaler kan vokse mellem beskeder.
Multi-step Hermes+n8n+LangGraph-planlægning, hvor “Done / In Progress / Blocked / Next Steps” skal overleve kompaktering.
Claude/OpenRouter-forløb, hvor prompt caching kan reducere gentagne inputomkostninger.

Do not use / wait

Brug ikke komprimering som erstatning for skills, Honcho-memory eller wiki-artifacts.
Vent med LCM/plugin-context-engine, indtil der er konkret behov og dokumenteret gevinst.
Undgå at sætte threshold aggressivt lavt, hvis det skaber for tidlig komprimering i aktive sessions.
Stol ikke på aux compression, hvis summary-modellen har mindre kontekstvindue end hovedmodellen.

Public page note

Hermes’ native context compression and caching should be described publicly as a reliability and cost-control layer for long agent sessions, not as a replacement for durable memory, skills, or artifacts.

Context Compression and Caching