Oktatóanyag: A RAG beágyazási és csevegési modelljeinek kiválasztása az Azure AI Searchben

Cikk
12/18/2024

Az Azure AI Searchre épülő RAG-megoldások függőséget igényelnek a vektorizálási modellek beágyazásán, valamint az adatok közötti beszélgetési kereséshez használt csevegőmodelleken.

Az oktatóanyag során az alábbi lépéseket fogja végrehajtani:

Megtudhatja, hogy az Azure-felhő mely modelljei működnek a beépített integrációval
Tudnivalók a csevegéshez használt Azure-modellekről
Modellek üzembe helyezése és a kód modelladatainak összegyűjtése
A keresőmotor Azure-modellekhez való hozzáférésének konfigurálása
Ismerje meg a nem Azure-beli modellek csatolásához szükséges egyéni képességeket és vektorizálókat

Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.

Előfeltételek

Az Azure Portal, amely modellek üzembe helyezésére és szerepkör-hozzárendelések konfigurálására szolgál az Azure-felhőben.
Tulajdonosi vagy felhasználói hozzáférés-rendszergazdai szerepkör az Azure-előfizetésben, amely a szerepkör-hozzárendelések létrehozásához szükséges. Ebben az oktatóanyagban legalább három Azure-erőforrást használ. A kapcsolatok hitelesítése Microsoft Entra-azonosítóval történik, amelyhez szerepkörök létrehozása szükséges. A modellekhez való csatlakozás szerepkör-hozzárendeléseit ebben a cikkben dokumentáljuk. Ha nem tud szerepköröket létrehozni, használhatja helyette az API-kulcsokat .
Egy modellszolgáltató, például az Azure OpenAI, az Azure AI Vision egy többszolgáltatásos Azure AI-erőforráson vagy az Azure AI Foundryn keresztül.

Ebben az oktatóanyagban az Azure OpenAI-t használjuk. Más szolgáltatók is szerepelnek a listában, hogy megismerje az integrált vektorizálási lehetőségeket.
Az Azure AI Search alapszintű vagy magasabb szintje egy szerepkör-hozzárendelésekben használt felügyelt identitást biztosít.
Egy megosztott régió. A sorozat összes oktatóanyagának elvégzéséhez a régiónak támogatnia kell az Azure AI Searcht és a modellszolgáltatót is. A támogatott régiókat a következő célokra tekinti meg:
Az Azure AI Search jelenleg néhány régióban korlátozott rendelkezésre állással rendelkezik. A régió állapotának megerősítéséhez ellenőrizze az Azure AI Search régiólistáját.

Tipp.

Tekintse meg ezt a cikket az átfedésben lévő régiók listájának megtekintéséhez.

A beépített vektorizálást támogató modellek áttekintése

A vektorizált tartalom javítja a lekérdezési eredményeket egy RAG-megoldásban. Az Azure AI Search támogatja az indexelési folyamat beépített vektorizálási műveletét. Emellett támogatja a vektorizálást a lekérdezések idején, a szöveg- vagy képbemeneteket beágyazásokká alakítva a vektorkereséshez. Ebben a lépésben azonosítsa a tartalomhoz és a lekérdezésekhez használható beágyazási modellt. Ha nyers vektoradatokat és nyersvektor-lekérdezéseket biztosít, vagy ha a RAG-megoldás nem tartalmaz vektoradatokat, hagyja ki ezt a lépést.

A szöveg-vektor konverziós lépést tartalmazó vektoros lekérdezések ugyanazt a beágyazási modellt kell használniuk, amelyet az indexelés során használtak. A keresőmotor nem ad hibát, ha különböző modelleket használ, de gyenge eredményeket kap.

Az azonos modellre vonatkozó követelmény teljesítéséhez válassza a beágyazási modelleket, amelyek az indexelés során végzett jártasságokon és a lekérdezés végrehajtása során vektorizálókon keresztül hivatkozhatók. Az alábbi táblázat a képesség- és vektorizáló párokat sorolja fel. A beágyazási modellek felhasználási módjának megtekintéséhez ugorjon előre, és hozzon létre egy indexelési folyamatot olyan kódhoz, amely beágyazási képességet és egy megfelelő vektorizálót hív meg.

Az Azure AI Search készség- és vektorfejlesztői támogatást nyújt az alábbi beágyazási modellekhez az Azure-felhőben.

Ügyfél	Modellek beágyazása	Készség	Vektorizáló
Azure OpenAI	text-embedding-ada-002, text-embedding-3-large, text-embedding-3-small	AzureOpenAIEmbedding	AzureOpenAIEmbedding
Azure AI Képfelismerés	multimodális 4.0 ¹	AzureAIVision	AzureAIVision
Azure AI Foundry-modellkatalógus	Facebook-DinoV2-Image-Embeddings-ViT-Base, Facebook-DinoV2-Image-Embeddings-ViT-Giant, Cohere-embed-v3-english, Cohere-embed-v3-többnyelvű	AML²	Azure AI Foundry-modellkatalógus

¹ Támogatja a kép- és szövegvektorálást.

² A modellkatalógusban üzembe helyezett modellek egy AML-végponton keresztül érhetők el. Ehhez a kapcsolathoz a meglévő AML-készséget használjuk.

Az itt felsorolt modelleken kívül más modelleket is használhat. További információ: Nem Azure-beli modellek használata beágyazásokhoz ebben a cikkben.

Feljegyzés

A beágyazási modellek bemenetei általában adattömbök. Az Azure AI Search RAG-mintában az adattömbkezelés az indexelő folyamatában történik, amely a sorozat egy másik oktatóanyagában található.

A generatív AI lekérdezési idején használt modelljeinek áttekintése

Az Azure AI Search nem rendelkezik csevegőmodellekhez használható integrációs kóddal, ezért olyan LLM-et kell választania, amelyet ismer, és amely megfelel a követelményeknek. A lekérdezési kódot úgy módosíthatja, hogy különböző modelleket próbáljon ki anélkül, hogy újra kellene építenie egy indexet, vagy újra kellene futtatnia az indexelési folyamat bármely részét. Tekintse át a Keresés elemet, és hozzon létre válaszokat a csevegőmodellt meghívó kódhoz.

Az alábbi modelleket gyakran használják csevegéses keresési élményhez:

Ügyfél	Csevegési modellek
Azure OpenAI	GPT-35-Turbo, GPT-4, GPT-4o, GPT-4 Turbo

A GPT-35-Turbo és a GPT-4 modellek úgy vannak optimalizálva, hogy beszélgetésként formázott bemenetekkel működjenek.

Ebben az oktatóanyagban a GPT-4o-t használjuk. A tesztelés során megállapítottuk, hogy kevésbé valószínű a saját betanítási adatainak kiegészítése. Ha például "a föld mekkora részét borítja víz?", a GPT-35-Turbo a földről szóló beépített ismerete alapján azt válaszolta, hogy a föld 71%-át víz borítja, annak ellenére, hogy a mintaadatok nem adják meg ezt a tényt. Ezzel szemben, GPT-4o válaszolt (helyesen) a "Nem tudom".

Modellek üzembe helyezése és információk gyűjtése

A modelleket egy végponton keresztül kell üzembe helyezni és elérhetővé tenni. A beágyazással kapcsolatos készségeknek és a vektorizálóknak egyaránt szükségük van a dimenziók számára és a modell nevére.

Ez az oktatóanyag-sorozat a következő modelleket és modellszolgáltatókat használja:

Text-embedding-3-large az Azure OpenAI-ban beágyazáshoz
GPT-4o az Azure OpenAI-ban a csevegés befejezéséhez

A modellek Azure OpenAI-ban való üzembe helyezéséhez a Cognitive Services OpenAI-közreműködője vagy annál magasabb szintű közreműködője szükséges.

Nyissa meg az Azure AI Foundryt.
A bal oldali menüben válassza a Központi telepítések lehetőséget.
Válassza a Modell>üzembe helyezése alapmodellt.
A legördülő listából válassza a 3-nagy méretű szövegbe ágyazás lehetőséget, és erősítse meg a kijelölést.
Adja meg az üzembe helyezés nevét. Javasoljuk, hogy "text-embedding-3-large".
Fogadja el az alapértelmezett beállításokat.
Válassza az Üzembe helyezés lehetőséget.
Ismételje meg az előző lépéseket a gpt-4o esetében.
Jegyezze fel a modellneveket és a végpontot. A beágyazási képességek és a vektorizálók belsőleg állítják össze a teljes végpontot, így csak az erőforrás URI-ra van szüksége. Adott például az a végpont, https://MY-FAKE-ACCOUNT.openai.azure.com/openai/deployments/text-embedding-3-large/embeddings?api-version=2024-06-01amelyet a képesség- és vektorizáló-definíciókban meg kell adnia.https://MY-FAKE-ACCOUNT.openai.azure.com

A keresőmotor Azure-modellekhez való hozzáférésének konfigurálása

A folyamatok és lekérdezések végrehajtásához ez az oktatóanyag a Microsoft Entra-azonosítót használja hitelesítéshez és szerepkörökhöz az engedélyezéshez.

Rendelje hozzá saját magát és a keresési szolgáltatás identitásengedélyeit az Azure OpenAI-ban. Az oktatóanyag kódja helyileg fut. Az Azure OpenAI-kérések a rendszerből származnak. Emellett a keresőmotor keresési eredményeit az Azure OpenAI-nak is átadja a rendszer. Ezért Önnek és a keresési szolgáltatásnak is engedélyre van szüksége az Azure OpenAI-hoz.

Jelentkezzen be az Azure Portalra , és keresse meg a keresési szolgáltatást.
Az Azure AI Search konfigurálása rendszer által felügyelt identitás használatára.
Keresse meg az Azure OpenAI-erőforrást.
A bal oldali menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.
Válassza a Szerepkör-hozzárendelés hozzáadása lehetőséget.
Válassza a Cognitive Services OpenAI-felhasználót.
Válassza a Felügyelt identitás lehetőséget, majd válassza a Tagok lehetőséget. Keresse meg a keresési szolgáltatás rendszer által felügyelt identitását a legördülő listában.
Ezután válassza a Felhasználó, csoport vagy szolgáltatásnév lehetőséget, majd válassza a Tagok lehetőséget. Keresse meg a felhasználói fiókját, majd válassza ki a legördülő listából.
Győződjön meg arról, hogy két biztonsági tag van hozzárendelve a szerepkörhöz.
Válassza a Véleményezés és hozzárendelés lehetőséget a szerepkör-hozzárendelések létrehozásához.

Az Azure AI Vision modelljeihez való hozzáféréshez rendelje hozzá a Cognitive Services OpenAI-felhasználót. Az Azure AI Foundry esetében rendelje hozzá az Azure AI Developert.

Nem Azure-beli modellek használata beágyazáshoz

A beágyazási modellek integrálásának mintája az, hogy egy egyéni képességbe és egyéni vektorizálóba burkoljuk. Ez a szakasz hivatkozásokat tartalmaz hivatkozási cikkekre. Ha egy nem Azure-beli modellt hív meg, tekintse meg az egyéni beágyazások bemutatóját.

Ügyfél	Modellek beágyazása	Készség	Vektorizáló
Bármelyik	Bármelyik	egyéni képesség	egyéni vektorizáló

Következő lépés

Index tervezése

Megosztás a következőn keresztül: