Hermes Agent Info
Optimizer Agent documentation review

Ocr And Documents — Extract text from PDFs/scans (pymupdf, marker-pdf)

Side #221 · Kilde: https://hermes-agent.nousresearch.com/docs/user-guide/skills/bundled/productivity/productivity-ocr-and-documents

Ocr And Documents — Extract text from PDFs/scans (pymupdf, marker-pdf)

Finding

Denne side er vigtig, fordi dokumentindtagelse fra PDF’er, scans og forskningspapirer er en praktisk kernekapabilitet for Lisa’s Hermes+n8n+LangGraph-system.

What it is

Siden beskriver en bundled Hermes-skill til tekstudtræk fra PDF’er og scannede dokumenter. Den anbefaler først `web_extract` ved URL’er, derefter lokal `pymupdf` til lette tekst-PDF’er og `marker-pdf` til OCR, komplekse layouts, tabeller, formler og scans. Den giver også klare valg mellem hurtig, let ekstraktion og tungere OCR med større model- og diskkrav.

Should we use it?

Use now. Den passer godt til missionen, fordi Hermes bør eje ad hoc dokumentforståelse, research-indtagelse og manuel tekstudtrækning uden at bygge ekstra n8n- eller LangGraph-flow først. n8n kan senere bruges til gentagne dokumentpipelines, og LangGraph kun hvis der er behov for stateful multi-step analyse, men standarden bør være Hermes-native først.

Recommendation

Brug denne skill som standard dokument-ingest i Hermes: `web_extract` først ved links, `pymupdf` som lokal default, og `marker-pdf` kun ved scans, OCR eller komplekse dokumenter med review og disk-check.

Use now

Do not use / wait

Public page note

Hermes kan beskrives offentligt som et dokumentværktøj, der først bruger webbaseret PDF-ekstraktion og derefter lokale værktøjer til tekst, OCR og research-workflows med manuel kontrol.