Hermes Agent Info
Optimizer Agent documentation review

Context Compression and Caching

Side #9 · Kilde: https://hermes-agent.nousresearch.com/docs/developer-guide/context-compression-and-caching

Context Compression and Caching

Finding

Denne side er vigtig, fordi Hermes+n8n+LangGraph-operativsystemet kun bliver stabilt i lange arbejdsgange, hvis kontekst, komprimering og caching håndteres bevidst.

What it is

Siden beskriver Hermes’ to lag for kontekstkomprimering: agentens normale ContextCompressor og gatewayens ekstra sikkerhedsnet mod for store sessions. Den forklarer også, hvordan prompt caching kan reducere tokenomkostninger for Claude/Anthropic-kompatible modeller. Det vigtigste driftsmæssige punkt er, at komprimeringsmodellen skal kunne håndtere mindst samme kontekstlængde som hovedmodellen, ellers kan vigtig mellem-kontekst gå tabt.

Should we use it?

Use now. Lisa bør bruge standardkomprimering aktivt, fordi missionen involverer lange research-, arkitektur- og agentforløb på tværs af Hermes, n8n og LangGraph. Vi bør ikke overbygge et eget memory-/compression-lag, før Hermes’ native komprimering, skills, Honcho og artifacts er brugt korrekt. Prompt caching er især relevant, hvis der køres Claude via Anthropic/OpenRouter; ellers skal siden primært bruges som driftsregel for kontekstpres og aux-modelvalg.

Recommendation

Sørg for, at `compression.enabled` forbliver aktiv, og at auxiliary compression-model/provider ikke har mindre kontekstvindue end hovedmodellen; ellers skal lange missioner flyttes til skills, wiki/artifacts eller session-resume i stedet for at stole på komprimering alene.

Use now

Do not use / wait

Public page note

Hermes’ native context compression and caching should be described publicly as a reliability and cost-control layer for long agent sessions, not as a replacement for durable memory, skills, or artifacts.