Voice Mode
Voice Mode
Finding
Voice Mode er vigtigt, fordi det gør Hermes brugbar som en hands-free operationsassistent på CLI, Telegram og Discord uden at flytte agentlogik ud i n8n eller LangGraph.
What it is
Voice Mode giver Hermes tale-ind og tale-ud via mikrofon, voice messages og eventuelt Discord voice channels. Siden beskriver STT, TTS, gateway voice replies, Discord voice channel setup, konfiguration og fejlsøgning. Den vigtigste pointe er, at Hermes selv kan håndtere stemmeinput, transskription, svar og oplæsning som en native agentfunktion.
Should we use it?
Use now. For Lisa’s Hermes+n8n+LangGraph mission bør Voice Mode bruges som brugerflade-lag, ikke som workflow-motor. Hermes skal stadig eje agentlogik, memory, toolsets og skills; n8n skal ikke bygge separat stemme-agent, medmindre det kun handler om ekstern routing eller integration. Discord voice channels bør vente, fordi Lisa ikke ønsker Discord-integrationer som standard.
Recommendation
Brug Voice Mode primært i Telegram og CLI med Edge TTS og lokal eller billig STT; hold Discord voice channel-funktioner ude af standarddrift, indtil der findes et konkret team- eller mødebehov.
Use now
- Når Lisa vil sende korte voice messages til Hermes i Telegram og få tekst eller kort oplæst svar tilbage.
- Når Hermes skal bruges hands-free til status, små beslutninger, idéfangst eller CoS-lignende interaktion.
- Når CLI bruges lokalt med push-to-talk til hurtig operativ dialog.
- Når offentlig dokumentation skal forklare, at Hermes kan være både tekst- og stemmebaseret uden ekstra agentlag.
Do not use / wait
- Vent med Discord voice channels, fordi Discord ikke er en ønsket integration i Lisa’s setup lige nu.
- Brug ikke Voice Mode som erstatning for cron, kanban, skills eller LangGraph-state; det er en interaktionskanal, ikke orkestrering.
- Brug ikke premium TTS/STT som standard, før gratis Edge TTS eller lokal/Groq Whisper viser sig utilstrækkeligt.
- Undgå “voice replies for all messages” i lange tekniske sessions, hvor TTS kan blive støjende og langsomt.
Public page note
Voice Mode kan beskrives offentligt som Hermes’ native stemmeinterface til taleinput, transskription og oplæste svar på CLI og messaging-platforme, uden at dele private tokens, chatindhold eller konfigurationsværdier.