Faiss — Facebook's library for efficient similarity search and clustering of dense vectors
Faiss — Facebook's library for efficient similarity search and clustering of dense vectors
Finding
Faiss er relevant, fordi det kan blive Lisas hurtige lokale søgelag for store embedding-samlinger, men det bør ikke erstatte Hermes’ memory, wiki eller governance-lag.
What it is
Faiss er et high-performance bibliotek til similarity search i dense vectors, især når man har mange embeddings og skal finde nærmeste naboer hurtigt. Det understøtter forskellige indeks-typer som Flat, IVF, HNSW og PQ, samt GPU-acceleration til større workloads. Det er bedst til ren vektorsøgning uden tung metadata-filtrering eller databasefunktioner.
Should we use it?
Use later. For Lisa’s Hermes+n8n+LangGraph mission giver Faiss mening, når research-wiki, dokumentarkiv, CLIP-embeddings eller andre lokale embedding-samlinger bliver store nok til, at simpel søgning ikke er nok. Lige nu bør Hermes først eje governance, memory, skills og research-arkiv; Faiss bør komme ind som et specialiseret retrieval-lag, ikke som generel memory-erstatning. Hvis metadata-filtrering, permissions eller audit trail bliver vigtigere end rå hastighed, er Chroma, Weaviate eller et andet vector DB-lag bedre.
Recommendation
Vent med installation, men marker Faiss som standardvalg til lokal, high-performance embedding search, når Lisa har en konkret stor samling af research-, dokument- eller billed-embeddings.
Use now
- Når Hermes skal lave hurtig lokal k-NN søgning over mange dokument-embeddings.
- Når CLIP-baseret billedsøgning skal kobles til et lokalt index.
- Når batch-retrieval eller offline analyse kræver høj hastighed uden ekstern vector database.
- Når data bør blive lokalt og ikke sendes til en hosted vector service.
Do not use / wait
- Vent hvis datasættet stadig er lille nok til simpel fil-, wiki- eller database-søgning.
- Brug det ikke som erstatning for Honcho memory eller Hermes session/context governance.
- Brug det ikke som primært lager, hvis metadata-filtrering, permissions, audit logs eller CRUD-databasefunktioner er centrale.
- Undgå GPU-sporet, indtil der er dokumenteret behov og stabil infrastruktur til det.
Public page note
Faiss er et stærkt lokalt retrieval-værktøj til store embedding-samlinger, men i Lisas agent-OS bør det bruges som specialiseret søgeindeks og ikke som primært memory- eller governance-lag.