Hermes Agent Info
Optimizer Agent documentation review

Nemo Curator — GPU-accelerated data curation for LLM training

Side #288 · Kilde: https://hermes-agent.nousresearch.com/docs/user-guide/skills/optional/mlops/mlops-nemo-curator

Nemo Curator — GPU-accelerated data curation for LLM training

Finding

Nemo Curator er relevant, fordi det kan blive et stærkt specialistværktøj, hvis Lisa senere skal kuratere store datasæt til træning, finetuning eller evals.

What it is

Nemo Curator er en optional Hermes-skill til GPU-accelereret dataklargøring for LLM-træningsdata. Den dækker bl.a. deduplikering, kvalitetsfiltrering, PII-redaktion, NSFW-detektion og multimodale datasæt med tekst, billeder, video og lyd. Den er især bygget til store datasæt, hvor GPU-acceleration og distribueret behandling kan spare meget tid.

Should we use it?

Use later. For Lisa’s Hermes+n8n+LangGraph mission er den ikke en kernekomponent lige nu, fordi systemets vigtigste behov er agentdrift, workflows, governance, public-safe content og integrationer — ikke stor-skala modeltræningsdata. Den bør først aktiveres, når der findes et konkret datasæt, et konkret trænings-/evalformål og adgang til passende GPU-miljø.

Recommendation

Behandl Nemo Curator som en MLOps-specialist-skill til fremtidige datasætprojekter, ikke som en standarddel af Hermes runtime eller n8n/LangGraph-orkestreringen.

Use now

Do not use / wait

Public page note

Nemo Curator kan beskrives offentligt som en avanceret optional MLOps-skill til stor-skala datakvalitet, deduplikering og sikker datasætforberedelse før LLM-træning eller evaluering.