Azure Cosmos DB의 벡터 검색
벡터 검색은 속성 필드의 정확한 일치가 아닌 데이터 특성을 기반으로 유사한 항목을 찾는 데 도움이 되는 방법입니다. 이 기술은 유사한 텍스트 검색, 관련 이미지 찾기, 권장 사항 제공 또는 변칙 징후 검색과 같은 애플리케이션에 유용합니다. 데이터 및 쿼리의 벡터 포함을 수행한 다음 데이터 벡터와 쿼리 벡터 사이의 거리를 측정하여 작동합니다. 쿼리 벡터에 가장 가까운 데이터 벡터는 의미상 가장 유사한 것으로 확인된 벡터입니다.
예제
이 대화형 시각화는 벡터 간의 근접성과 거리에 대한 몇 가지 예를 보여 줍니다.
알고리즘
두 가지 주요 유형의 벡터 검색 알고리즘은 kNN(k-nearest neighbors)과 근사한 인접 항목(ANN)입니다. kNN과 ANN사이에서 후자는 정확도와 효율성 간의 균형을 제공하여 대규모 애플리케이션에 더 적합합니다. 잘 알려진 일부 ANN 알고리즘으로는 IVF(Inverted File), HNSW(Hierarchical Navigable Small World) 및 최첨단 DiskANN 등이 포함됩니다.
완전 기능을 갖춘 데이터베이스에서 통합 벡터 검색 기능을 사용하면(순수 벡터 데이터베이스가 아니라) 다른 애플리케이션 데이터를 바로 함께 사용하여 고차원 벡터 데이터를 저장, 인덱싱, 검색하는 효율적인 방법을 제공합니다. 이 방법은 데이터를 비용이 더 많이 드는 대체 벡터 데이터베이스로 마이그레이션할 필요성을 제거하고 AI 기반 애플리케이션의 원활한 통합을 제공합니다.