Hermes Agent Info
Optimizer Agent documentation review

Run Local LLMs on Mac

Side #44 · Kilde: https://hermes-agent.nousresearch.com/docs/guides/local-llm-on-mac

Run Local LLMs on Mac

Finding

Denne side er vigtig, fordi den viser en Hermes-native vej til private, lokale model-endpoints uden at bygge ekstra model-routing i n8n eller LangGraph.

What it is

Siden forklarer, hvordan man kører en lokal OpenAI-kompatibel LLM-server på Apple Silicon Mac med enten llama.cpp eller MLX via omlx. Begge kan eksponere et `/v1/chat/completions`-endpoint, som Hermes kan bruge som custom endpoint. Den vigtigste driftsidé er, at lokale modeller kan give privat, billig testkapacitet, især med quantized KV cache i llama.cpp på mindre Macs.

Should we use it?

Use later. For Lisa’s Hermes+n8n+LangGraph mission er dette relevant som lokal udviklings- og fallback-kapacitet, ikke som primær drift nu. Den nuværende mission bør stadig prioritere den centrale Hermes-modelstack, gateway, cron, skills, n8n flows og LangGraph-arkitektur. Lokale Mac-modeller giver mest værdi, når Lisa vil teste prompts, workflows eller private dokumenter uden API-omkostninger og uden at sende data ud.

Recommendation

Behandl local LLM on Mac som en fremtidig “private dev sandbox” for Hermes: brug den til prompt-/workflow-test og privacy-sensitive eksperimenter, men ikke som primær produktionsmodel for Lisa’s Hermes OS endnu.

Use now

Do not use / wait

Public page note

Hermes kan kobles til lokale Mac-modeller via OpenAI-kompatible endpoints, så udvikling og private test kan køre billigere og mere lokalt uden ekstra agent-infrastruktur.