Context Compression and Caching
Context Compression and Caching
Finding
Denne side er vigtig, fordi Hermes+n8n+LangGraph-operativsystemet kun bliver stabilt i lange arbejdsgange, hvis kontekst, komprimering og caching håndteres bevidst.
What it is
Siden beskriver Hermes’ to lag for kontekstkomprimering: agentens normale ContextCompressor og gatewayens ekstra sikkerhedsnet mod for store sessions. Den forklarer også, hvordan prompt caching kan reducere tokenomkostninger for Claude/Anthropic-kompatible modeller. Det vigtigste driftsmæssige punkt er, at komprimeringsmodellen skal kunne håndtere mindst samme kontekstlængde som hovedmodellen, ellers kan vigtig mellem-kontekst gå tabt.
Should we use it?
Use now. Lisa bør bruge standardkomprimering aktivt, fordi missionen involverer lange research-, arkitektur- og agentforløb på tværs af Hermes, n8n og LangGraph. Vi bør ikke overbygge et eget memory-/compression-lag, før Hermes’ native komprimering, skills, Honcho og artifacts er brugt korrekt. Prompt caching er især relevant, hvis der køres Claude via Anthropic/OpenRouter; ellers skal siden primært bruges som driftsregel for kontekstpres og aux-modelvalg.
Recommendation
Sørg for, at `compression.enabled` forbliver aktiv, og at auxiliary compression-model/provider ikke har mindre kontekstvindue end hovedmodellen; ellers skal lange missioner flyttes til skills, wiki/artifacts eller session-resume i stedet for at stole på komprimering alene.
Use now
- Lange Hermes-sessioner med research, debugging, arkitektur og dokumentationsarbejde.
- Telegram/gateway-sessions, hvor samtaler kan vokse mellem beskeder.
- Multi-step Hermes+n8n+LangGraph-planlægning, hvor “Done / In Progress / Blocked / Next Steps” skal overleve kompaktering.
- Claude/OpenRouter-forløb, hvor prompt caching kan reducere gentagne inputomkostninger.
Do not use / wait
- Brug ikke komprimering som erstatning for skills, Honcho-memory eller wiki-artifacts.
- Vent med LCM/plugin-context-engine, indtil der er konkret behov og dokumenteret gevinst.
- Undgå at sætte threshold aggressivt lavt, hvis det skaber for tidlig komprimering i aktive sessions.
- Stol ikke på aux compression, hvis summary-modellen har mindre kontekstvindue end hovedmodellen.
Public page note
Hermes’ native context compression and caching should be described publicly as a reliability and cost-control layer for long agent sessions, not as a replacement for durable memory, skills, or artifacts.