Infrastructuur
Vector Database
Een vector database is een gespecialiseerd opslagsysteem voor embeddings, waarin razendsnel naar semantisch vergelijkbare items gezocht kan worden. Vector databases zoals Pinecone en Weaviate vormen de ruggengraat van moderne RAG-architecturen en semantic search-toepassingen in enterprise-AI.
Wat is een Vector Database
Een vector database is een database die geoptimaliseerd is voor het opslaan en doorzoeken van hoge-dimensionale vectoren. In tegenstelling tot traditionele databases die op exacte waarden zoeken, vinden vector databases items op basis van similariteit met behulp van algoritmes zoals approximate nearest neighbour (ANN), HNSW en IVF.
Waarom belangrijk
Embeddings zijn nutteloos zonder een efficiënte manier om er op te zoeken. Bij miljoenen documenten of producten is een naïve berekening te traag. Vector databases zoals Pinecone, Weaviate, Qdrant, Milvus en pgvector lossen dit op met geoptimaliseerde index-structuren die in milliseconden de top-k meest vergelijkbare items vinden.
Belangrijkste features
Moderne vector databases bieden hybride search (combinatie van vector- en keyword-zoeken), metadata-filtering, multi-tenancy, replicatie en schaalbaarheid. Voor enterprise-deployment zijn aspecten als datasoevereiniteit, encryptie en GDPR-compliance kritisch. Pinecone biedt managed cloud, terwijl Weaviate ook on-premises gedraaid kan worden.
Integratie met LLMs
Vector databases zijn de centrale component in RAG-architecturen. Frameworks zoals LangChain en LlamaIndex bieden directe integraties, waardoor embeddings van GPT-4o, Claude 3.5 of open-source modellen naadloos verbonden worden met de juiste data. De combinatie met Azure OpenAI of AWS Bedrock vormt een typische enterprise-stack.
Voorbeelden
Artificial Intelligence Consultant selecteert per use case de juiste vector database. Voor een Europese bank met strikte ISO 27001-vereisten wordt vaak gekozen voor Weaviate in een private LLM Stack. Voor wereldwijde retailers met hoge zoekvolumes is Pinecone een efficiënte managed oplossing met sub-second latency.
Synoniemen
- vectoropslag
- vector store
- similarity database
Voorbeelden
- Pinecone voor productzoekindex
- Weaviate als hybride zoekplatform
- pgvector binnen PostgreSQL voor enterprise data
Laatst bijgewerkt: 15 april 2026