Dspy — DSPy: declarative LM programs, auto-optimize prompts, RAG
Dspy — DSPy: declarative LM programs, auto-optimize prompts, RAG
Finding
DSPy er relevant, fordi det kan give Lisa en systematisk metode til at forbedre prompts, RAG-komponenter og LM-pipelines med data i stedet for manuel prompt-gætning.
What it is
DSPy er en Python-baseret tilgang til at bygge LM-programmer som deklarative moduler med tydelige input/output-signaturer. Siden viser, hvordan man kan lave QA, Chain-of-Thought, RAG, ReAct-lignende værktøjsbrug og multi-stage pipelines. Den vigtigste værdi er optimizer-laget, hvor DSPy kan teste og forbedre prompts eller demonstrationsdata ud fra metrics og trænings-/eval-eksempler.
Should we use it?
Use later. DSPy passer godt til Lisa’s Hermes+n8n+LangGraph-mission, men først når vi har konkrete eval-sæt og stabile use cases, hvor promptkvalitet faktisk skal måles og forbedres. Hermes bør stadig eje sessioner, skills, gateway, memory og tool governance; DSPy bør kun bruges som et forsknings-/optimeringslag til specifikke RAG- eller klassifikationskomponenter, ikke som ny agent-runtime.
Recommendation
Brug DSPy som et kontrolleret eval- og promptoptimeringsværktøj for udvalgte Hermes/LangGraph-komponenter, når der findes repræsentative testdata, klare metrics og et behov for målbar forbedring.
Use now
- Eksperimenter med RAG-svar, hvor vi kan sammenligne før/efter på et lille datasæt.
- Promptoptimering for gentagne klassifikations- eller routingopgaver.
- Test af strukturerede outputs, hvor Pydantic-lignende felter og validering er nyttige.
- Research prototypes, hvor Hermes kan generere, teste og dokumentere DSPy-varianter manuelt.
Do not use / wait
- Ikke som erstatning for Hermes skills, memory, cron, gateway eller delegation.
- Ikke til n8n-flowlogik, hvor almindelige n8n-noder er nok.
- Ikke til LangGraph-state management; DSPy optimerer LM-komponenter, ikke hele orchestration-laget.
- Ikke før vi har eval-data, metrics og en klar “bedre end baseline”-definition.
Public page note
DSPy kan beskrives offentligt som et avanceret Hermes research-skill til målbar prompt-, RAG- og LM-pipeline-optimering, bedst brugt efter baseline og eval-data er på plads.