Vad är avståndsfunktioner?
Avståndsfunktioner är matematiska formler som används för att mäta likheten eller skillnaden mellan vektorer (se vektorsökning). Vanliga exempel är Manhattan-avstånd, Euklidiska avstånd, cosinuslikhet och punktprodukt. Dessa mätningar är avgörande för att avgöra hur nära relaterade två datadelar är.
Manhattan avstånd
Detta mäter avståndet mellan två punkter genom att lägga ihop de absoluta skillnaderna mellan deras koordinater. Föreställ dig att gå i en rutnätsliknande stad, till exempel många stadsdelar på Manhattan; det är det totala antalet block du går nord-syd och öst-väst.
Euklidiska avstånd
Euklidiska avstånd mäter det räta avståndet mellan två punkter. Den är uppkallad efter den antika matematikern Euclid, som ofta kallas "geometrins fader".
Cosinélikhet
Cosinernas likhet mäter vinkelns cosiné mellan två vektorer som projiceras i ett flerdimensionellt utrymme. Två dokument kan vara långt ifrån varandra av euklidiska avstånd på grund av dokumentstorlekar, men de kan fortfarande ha en mindre vinkel mellan dem och därför hög cosinuslikhet.
Dot-produkt
Två vektorer multipliceras för att returnera ett enda tal. Den kombinerar de två vektorernas magnituder och vinkelns cosiné mellan dem, vilket visar hur mycket en vektor går i riktning mot en annan.
Relaterat innehåll
- Funktionen VectorDistance-system i Azure Cosmos DB NoSQL
- Vad är en vektordatabas?
- Hämtning av utökad generation (RAG)
- Vektordatabas i Azure Cosmos DB NoSQL
- Vektordatabas i Azure Cosmos DB för MongoDB
- Vad är vektorsökning?
- LLM-token
- Vektorbäddningar
- kNN vs ANN-vektorsökningsalgoritmer