Browser CDP Supervisor — Design
Browser CDP Supervisor — Design
Finding
Browser CDP Supervisor gør Hermes-browserautomation mere driftssikker, især når webapps bruger native dialogbokse eller cross-origin iframes.
What it is
Det er en Hermes-browserfunktion, der holder en løbende CDP-forbindelse til browseren og overvåger dialoger, frame tree, OOPIF-iframes og relevante browserhændelser. Den gør `alert`, `confirm`, `prompt` og iframe-strukturer synlige i `browser_snapshot`, så agenten ikke bare hænger eller fejler uklart. Den tilføjer også `browser_dialog(...)`, så agenten eksplicit kan acceptere eller afvise dialoger, når backend’en understøtter det.
Should we use it?
Use now. For Lisa’s Hermes+n8n+LangGraph mission er det relevant, når Hermes skal arbejde i komplekse webgrænseflader som n8n, dashboards, loginflows, embedded panels eller testmiljøer med iframes. Det bør bruges med Browserbase eller lokal Chrome/CDP, ikke som generel erstatning for API-baserede flows. LangGraph- og n8n-arbejde bør stadig foretrække API/webhook/MCP, men browser-supervisoren er nyttig som fallback og til UI-verifikation.
Recommendation
Brug Browser CDP Supervisor som standardmønster for Hermes-browserautomation med Browserbase eller lokal Chrome, og behold `browser.dialog_policy: must_respond`, så dialoger bliver synlige og håndteret eksplicit i stedet for automatisk skjult.
Use now
- Når Hermes tester eller verificerer n8n UI-flows, formularer, dashboards eller embedded widgets.
- Når en browseropgave kan blive blokeret af `alert`, `confirm`, `prompt` eller `beforeunload`.
- Når Hermes skal inspicere cross-origin iframes via `browser_snapshot.frame_tree` og bruge `browser_cdp(frame_id=...)`.
- Når Browserbase bruges til mere stabile, længere browser-sessioner, hvor stateless CDP-kald kan være mindre pålidelige.
- Når en agent skal diagnosticere “browseren hænger”-symptomer uden at gætte, om en dialog er åben.
Do not use / wait
- Brug det ikke til Camofox-baserede flows endnu; siden siger tydeligt, at Camofox mangler CDP-understøttelse for denne funktion.
- Brug det ikke som førstevalg til n8n- eller LangGraph-automatisering, hvis API, webhook, CLI eller MCP kan løse opgaven mere stabilt.
- Brug det ikke til at bygge permanent browser-afhængig drift, hvor en backend-integration kan erstatte UI-kliks.
- Vent med Camofox-dialogstrategier, indtil upstream får dialog polling og frame-tree introspection.
Public page note
Browser CDP Supervisor viser, hvordan Hermes gør browserautomation mere robust ved at opdage dialoger og iframes, så agenter kan håndtere komplekse webapps uden skjulte browserblokeringer.