Hermes Agent Info / LLM / Test LLM Indbygget web search

Test: LLM med indbygget web search

Formålet er at finde billige, kildebaserede metoder til danske app-beskrivelser uden at omskrive samme app igen og igen.

Genereret: 2026-06-10T14:06:23.580695+00:00

Konklusion

NanoGPT /api/web provider=linkup outputType=sourcedAnswer for cheap sourced Danish descriptions; exa-answer is best chat fallback; OpenRouter Fusion for high-stakes review.

Metoder testet15
Bestået10
Fejlet5
OpenRouter katalog-hits16

Testresultater

MetodeStatusLatencyPrisKilderAnbefaling
openrouter:openai/gpt-4o-mini-search-previewbestået6.210.0281Brug kun til hurtige brede opslag med eftervalidering.
openrouter:openrouter/fusionbestået63.590.3593Brug til vigtig research, ikke batch for alle apps.
nanogpt-chat:linkup-research-lowbestået42.180.26252Kan bruges selektivt
nanogpt-chat:fastgptfejlet0.19Undgå pt.
nanogpt-chat:bravebestået2.940.056923Kan bruges selektivt
nanogpt-chat:exa-answerbestået2.90.0059God kandidat
nanogpt-web:linkup_standard_searchResultsbestået1.620.00615Rå kildeindsamling
nanogpt-web:linkup_standard_sourcedAnswerbestået3.090.00615Primær billig løsning
nanogpt-web:linkup_standard_structuredfejletIkke anbefalet pt.
nanogpt-web:linkup_deep_searchResultsbeståetRå kildeindsamling
nanogpt-web:brave_standard_searchResultsbestået1.120.00510Rå kildeindsamling
nanogpt-web:brave_standard_sourcedAnswerfejletIkke anbefalet pt.
nanogpt-web:exa_standard_searchResultsbestået1.30.0055Rå kildeindsamling
nanogpt-web:exa_standard_sourcedAnswerfejletIkke anbefalet pt.
nanogpt-web:linkup_standard_answer_oldfejletIkke anbefalet pt.

Prompts og test-instrukser

Her er de konkrete prompts/instrukser, der blev brugt i smoke-testen.

OpenRouter: openai/gpt-4o-mini-search-preview

model: openai/gpt-4o-mini-search-preview
endpoint: https://openrouter.ai/api/v1/chat/completions
prompt: What is Hermes Agent by Nous Research? Find the official website URL and give a short description of its purpose. Cite your sources (URLs).
extra: web_search_options = {}

OpenRouter: openrouter/fusion

model: openrouter/fusion
endpoint: https://openrouter.ai/api/v1/chat/completions
prompt: What is Hermes Agent by Nous Research? Find the official website URL and give a short description of its purpose. Cite your sources (URLs).
extra: tool_choice = required

NanoGPT chat-modeller

endpoint: https://nano-gpt.com/api/v1/chat/completions
models: linkup-research-low, fastgpt, brave, exa-answer
prompt: Find the official website and give a concise purpose description for Hermes Agent by Nous Research. Include sources.

NanoGPT /api/web

endpoint: https://nano-gpt.com/api/web
query: Find official website + concise purpose for Hermes Agent by Nous Research with sources
providers: linkup, brave, exa
depth: standard/deep
outputType: searchResults, sourcedAnswer, structured

Uafhængig kritik

En separat agent har kritiseret testen. Hovedvurderingen: testen er et nyttigt smoke-test første udkast, men konklusionerne var for stærke til at være et produktionsbenchmark.

Prioriterede optimeringsforslag

  1. Definér en ground-truth tabel med 10 apps og verificerede canonical URLs.
  2. Kør 3 gentagelser pr. metode og rapportér P50/P95 latency + cost.
  3. Indfør URL-verifikation: HTTP status, redirect chain, canonical match og domæneautoritet.
  4. Test Perplexity Sonar, gpt-4o-search-preview og relace/relace-search.
  5. Tilføj danske prompts og scoring-rubric 0-5.
  6. Brug cache, fallback-kæde, circuit breaker og one-shot lock pr. app_ref_id.

Kritik som JSON · Kritik som markdown

Workflow 3B / 3C forslag

  1. Find apps i SQL hvor dansk beskrivelse mangler.
  2. Indsaml kilder med billig metode: først NanoGPT /api/web linkup sourcedAnswer eller searchResults.
  3. Gem kilder/snippets i SQL på app_ref_id.
  4. Lav dansk beskrivelse én gang med billig LLM ud fra kilderne.
  5. Opdater aldrig automatisk eksisterende dansk beskrivelse uden manuel markering.

Model discovery

OpenRouter modelkataloget kan filtreres på ord som web, search og research i model-id, navn og beskrivelse. Aktuelle hits:

Data