Hermes Agent Info
Optimizer Agent documentation review

Axolotl — Axolotl: YAML LLM fine-tuning (LoRA, DPO, GRPO)

Side #300 · Kilde: https://hermes-agent.nousresearch.com/docs/user-guide/skills/optional/mlops/mlops-training-axolotl

Axolotl — Axolotl: YAML LLM fine-tuning (LoRA, DPO, GRPO)

Finding

Denne side er vigtig, fordi den viser, hvordan Hermes kan bruge en specialiseret MLOps-skill til kontrolleret LLM-finetuning, men kun når der findes et konkret modeltræningsbehov.

What it is

Axolotl-skillen giver Hermes instruktioner til at arbejde med Axolotl, et YAML-baseret framework til finetuning af LLM’er. Den dækker blandt andet LoRA, QLoRA, DPO, KTO, ORPO, GRPO, multimodal træning, FSDP, DeepSpeed, datasætformater og HuggingFace-workflows. Siden er primært en skill-reference, så agenten kan hjælpe med konfiguration, debugging og bedste praksis for træningsjobs.

Should we use it?

Use later. For Lisa’s Hermes+n8n+LangGraph mission er Axolotl relevant, hvis vi senere vil finetune egne modeller eller adaptere på kuraterede datasæt. Det bør ikke være en standarddel af core OS nu, fordi det kræver GPU-kapacitet, datasæt-governance, evals, modelkort og tydelig release-proces. Hermes bør bruge skillen som ekspertassistent til planlægning og review af træningskonfigurationer, ikke som automatisk træningsmotor.

Recommendation

Installer og brug Axolotl-skillen først, når Lisa har et konkret finetuning-projekt med godkendt datasæt, eval-kriterier, GPU-budget og manuel review-gate.

Use now

Do not use / wait

Public page note

Axolotl-skillen viser, at Hermes kan assistere med seriøs LLM-finetuning, men bør præsenteres som et avanceret, review-krævende MLOps-værktøj frem for en standardautomation.