Optimizer Agent documentation review

Configuring Models

Side #78 · Kilde: https://hermes-agent.nousresearch.com/docs/user-guide/configuring-models

Configuring Models

Finding

Denne side er vigtig, fordi modelvalg, fallback og auxiliary tasks bør styres centralt i Hermes og ikke duplikeres i n8n eller LangGraph.

What it is

Siden forklarer, hvordan Hermes vælger hovedmodellen til agentens tænkning og separate auxiliary modeller til mindre sideopgaver som komprimering, vision, web-extract, sessionstitler, approval scoring, MCP-routing og skill search. Den viser både dashboard-flowet, slash command, `hermes model`, config.yaml og REST API. Den vigtigste pointe er, at ændringer typisk først gælder for nye sessioner, mens en aktiv chat kræver `/model` eller ny session/restart.

Should we use it?

Use now. For Lisa’s Hermes+n8n+LangGraph mission skal Hermes være single source of truth for modelvalg, fordi det reducerer dobbelt routing, fejl og token-spild. n8n bør ikke vælge LLM’er på vegne af Hermes-agenten, og LangGraph bør kun have egne modelvalg i særskilte stateful agentflows, hvor Hermes ikke allerede er runtime. Auxiliary modeller er især relevante nu, fordi dyre hovedmodeller ikke bør bruges til simple sideopgaver.

Recommendation

Brug Hermes’ modelkonfiguration aktivt til at holde en stærk hovedmodel til agentarbejde, men flyt billige sideopgaver som title generation, compression, web extract og approval over på hurtigere/billigere auxiliary modeller.

Use now

Når Lisa vil skifte primær Hermes-model uden at ændre n8n- eller LangGraph-flows.
Når dyre reasoning-modeller bruges unødvendigt til sessionstitler, web-sammendrag eller kontekstkomprimering.
Når Telegram/gateway-sessioner skal have stabil modeladfærd fra nye sessioner.
Når der skal testes en ny model via `/model` i én session, før den gøres global.
Når vision skal fungere, selv hvis hovedmodellen ikke har stærk billedforståelse.
Når smart approval bruges og bør vurderes af en billig, hurtig model i stedet for hovedmodellen.

Do not use / wait

Brug ikke dashboard-skift som forventning om, at en allerede åben chat automatisk skifter model.
Lad ikke n8n eller LangGraph opbygge parallel generel modelrouting for Hermes-opgaver.
Overstyr ikke alle auxiliary slots ukritisk, hvis den valgte model mangler vision, tool-routing kvalitet eller stabil provider-auth.
Vent med aggressive model-eksperimenter i produktion, indtil de er testet i en enkelt session eller som fallback.

Public page note

Hermes bør præsenteres som det centrale model-control layer, hvor hovedmodel og billige auxiliary modeller kan styres sikkert uden at sprede modelrouting ud i eksterne workflows.

Configuring Models