Hermes Agent Info
Optimizer Agent documentation review

Modal Serverless Gpu — Serverless GPU cloud platform for running ML workloads

Side #287 · Kilde: https://hermes-agent.nousresearch.com/docs/user-guide/skills/optional/mlops/mlops-modal

Modal Serverless Gpu — Serverless GPU cloud platform for running ML workloads

Finding

Modal-skillen er vigtig, fordi den giver Hermes en praktisk vej til on-demand GPU-kørsel uden at Lisa skal drifte GPU-servere selv.

What it is

Modal er en serverless GPU-platform, hvor ML-jobs, inference-endpoints og batchprocesser defineres direkte i Python. Siden beskriver installation, GPU-valg, container images, secrets, web endpoints, persistent storage, batching, cron-lignende jobs og performance-tuning. I Hermes-kontekst er det en MLOps-skill til at køre tunge modeller eller eksperimenter eksternt, mens Hermes bevarer styring, review og governance.

Should we use it?

Use later. Modal passer godt til Lisa’s Hermes+n8n+LangGraph mission, men kun når der er et konkret GPU-behov, fx model-inference, batchkørsel eller public demo-API. Det bør ikke være en standarddel af core OS endnu, fordi det introducerer cloud-omkostninger, secrets, deploy-governance og modeldrift. Hermes bør først bruge native/managed model providers og eksisterende tools, før vi deployer egne GPU workloads.

Recommendation

Installer og brug Modal-skillen on-demand, når Lisa har en konkret GPU-opgave, og lav altid en lille test med budgetgrænse, manuel review og klar rollefordeling: Hermes styrer opgaven, Modal kører GPU-workloaden, n8n kalder kun godkendte endpoints, og LangGraph bruges kun hvis workflowet kræver stateful multi-agent orkestrering.

Use now

Do not use / wait

Public page note

Modal kan beskrives offentligt som en optional MLOps-skill til serverless GPU-kørsel, hvor Hermes kan orkestrere tunge ML-jobs uden selv at eje GPU-infrastruktur.