Songsee — Audio spectrograms/features (mel, chroma, MFCC) via CLI
Songsee — Audio spectrograms/features (mel, chroma, MFCC) via CLI
Finding
Songsee er relevant, fordi Hermes kan lave visuelle lydanalyser direkte fra CLI uden at bygge et separat n8n- eller LangGraph-flow til basal audio-inspektion.
What it is
Songsee er en bundled Hermes-skill til at generere spektrogrammer og feature-visualiseringer fra lydfiler. Den kan vise fx standard spectrogram, mel-spectrogram, chroma, MFCC, tempogram, loudness og spectral flux. Den bruges via CLI og kan gemme output som PNG eller JPG, så resultatet bagefter kan vurderes visuelt eller med `vision_analyze`.
Should we use it?
Use later. Den passer godt til Lisa’s Hermes+n8n+LangGraph mission som et konkret, native Hermes-værktøj til debugging og dokumentation af lydoutput. Men den bør ikke være en kernefunktion endnu, medmindre Lisa begynder at arbejde systematisk med TTS-kvalitet, musikproduktion, voice pipelines eller audio-publicering. Hermes bør eje den manuelle analyse, mens n8n/LangGraph kun skal involveres, hvis audio-analyse bliver en del af et større produktionsflow.
Recommendation
Brug Songsee som on-demand Hermes-skill til audio-debugging og public-safe dokumentation, men vent med fast integration, indtil der findes en gentagen lydpipeline i Lisa’s system.
Use now
- Når Hermes skal sammenligne to TTS- eller voice-outputfiler visuelt.
- Når en lydfil lyder forkert, og Lisa vil se loudness, onset, frekvensmønster eller timing.
- Når Hermes Agent Info skal forklare audio-/voice-workflows med et visuelt eksempel.
- Når et kreativt musik- eller voice-demo-output skal dokumenteres før publicering.
- Når `vision_analyze` bagefter skal bruges til at beskrive et genereret spektrogram.
Do not use / wait
- Brug det ikke som standarddel af alle TTS-svar eller Telegram voice-replies.
- Brug det ikke til real-time monitoring eller automatiseret beslutningstagning uden manuel review.
- Vent med n8n/LangGraph-integration, indtil audio-analyse bliver et gentaget workflow.
- Brug det ikke til private, følsomme eller identificerbare lydoptagelser på public-facing sider.
- Brug det ikke, hvis opgaven kun kræver simpel afspilning eller filkonvertering.
Public page note
Songsee viser, hvordan Hermes kan analysere og visualisere lydfiler direkte som en native skill, nyttigt til TTS-debugging, musikdemoer og public-safe dokumentation af audio-workflows.