Page Agent
Page Agent
Finding
Page Agent er relevant, fordi det kan give et webinterface en indbygget natural-language copilot, men det ligger uden for Hermes’ kerneopgave som agent-runtime.
What it is
Page Agent er en optional Hermes-skill om alibaba/page-agent, som kan indlejres direkte i en webapp via script-tag eller npm-pakke. Den læser sidens DOM som tekst og udfører brugerens instruktioner i UI’et, fx “klik login” eller “udfyld brugernavn”. Den kræver en OpenAI-kompatibel LLM-endpoint og bør i produktion køre via en backend-proxy, så API-nøgler ikke eksponeres i browseren.
Should we use it?
Use later. For Lisa’s Hermes+n8n+LangGraph mission er den mest relevant, hvis Hermes Agent Info, et internt adminpanel eller et B2B-dashboard senere skal have en indlejret UI-copilot. Den bør ikke bruges til Hermes’ egen browserautomation, n8n-workflows eller LangGraph-orkestrering, fordi Hermes allerede har browser-tooling til server-side browserstyring. Den er bedst som produkt-/frontend-feature, ikke som operativ kernekomponent.
Recommendation
Hold Page Agent som “Use later” og dokumentér den som kandidat til fremtidige webapp-copilots, men installér den ikke som standardskill før der findes et konkret webinterface, backend-proxy og sikker allowlist/data-masking plan.
Use now
- Når Lisa vil prototype en natural-language copilot inde i en egen webapp eller adminside.
- Når et eksisterende dashboard skal gøres lettere at bruge uden at omskrive hele frontend.
- Når en demo skal vise, hvordan brugere kan styre et UI med almindeligt sprog.
- Når Page Agent skal evalueres mod Qwen, OpenAI, OpenRouter eller Ollama via en kontrolleret testside.
Do not use / wait
- Brug den ikke til at lade Hermes styre eksterne websites; brug Hermes’ browser tool i stedet.
- Brug den ikke i produktion med API-nøgler direkte i klientkoden.
- Brug den ikke til følsomme flows uden backend-proxy, allowlist, data-masking og manuel review.
- Vent hvis siden har streng CSP, uklar datagrænse eller behov for visuel/screenshot-baseret grounding.
Public page note
Page Agent kan offentligt beskrives som en optional Hermes-skill til at evaluere eller indlejre en browserbaseret UI-copilot i egne webapps, med tydelig advarsel om proxy, API-nøglesikkerhed og ikke at bruge demo-CDN i produktion.