Oktatóanyag: A RAG beágyazási és csevegési modelljeinek kiválasztása az Azure AI Searchben
Az Azure AI Searchre épülő RAG-megoldások függőséget igényelnek a vektorizálási modellek beágyazásán, valamint az adatok közötti beszélgetési kereséshez használt csevegőmodelleken.
Az oktatóanyag során az alábbi lépéseket fogja végrehajtani:
- Megtudhatja, hogy az Azure-felhő mely modelljei működnek a beépített integrációval
- Tudnivalók a csevegéshez használt Azure-modellekről
- Modellek üzembe helyezése és a kód modelladatainak összegyűjtése
- A keresőmotor Azure-modellekhez való hozzáférésének konfigurálása
- Ismerje meg a nem Azure-beli modellek csatolásához szükséges egyéni képességeket és vektorizálókat
Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.
Előfeltételek
Az Azure Portal, amely modellek üzembe helyezésére és szerepkör-hozzárendelések konfigurálására szolgál az Azure-felhőben.
Tulajdonosi vagy felhasználói hozzáférés-rendszergazdai szerepkör az Azure-előfizetésben, amely a szerepkör-hozzárendelések létrehozásához szükséges. Ebben az oktatóanyagban legalább három Azure-erőforrást használ. A kapcsolatok hitelesítése Microsoft Entra-azonosítóval történik, amelyhez szerepkörök létrehozása szükséges. A modellekhez való csatlakozás szerepkör-hozzárendeléseit ebben a cikkben dokumentáljuk. Ha nem tud szerepköröket létrehozni, használhatja helyette az API-kulcsokat .
Egy modellszolgáltató, például az Azure OpenAI, az Azure AI Vision egy többszolgáltatásos Azure AI-erőforráson vagy az Azure AI Foundryn keresztül.
Ebben az oktatóanyagban az Azure OpenAI-t használjuk. Más szolgáltatók is szerepelnek a listában, hogy megismerje az integrált vektorizálási lehetőségeket.
Az Azure AI Search alapszintű vagy magasabb szintje egy szerepkör-hozzárendelésekben használt felügyelt identitást biztosít.
Egy megosztott régió. A sorozat összes oktatóanyagának elvégzéséhez a régiónak támogatnia kell az Azure AI Searcht és a modellszolgáltatót is. A támogatott régiókat a következő célokra tekinti meg:
Az Azure AI Search jelenleg néhány régióban korlátozott rendelkezésre állással rendelkezik. A régió állapotának megerősítéséhez ellenőrizze az Azure AI Search régiólistáját.
Tipp.
Tekintse meg ezt a cikket az átfedésben lévő régiók listájának megtekintéséhez.
A beépített vektorizálást támogató modellek áttekintése
A vektorizált tartalom javítja a lekérdezési eredményeket egy RAG-megoldásban. Az Azure AI Search támogatja az indexelési folyamat beépített vektorizálási műveletét. Emellett támogatja a vektorizálást a lekérdezések idején, a szöveg- vagy képbemeneteket beágyazásokká alakítva a vektorkereséshez. Ebben a lépésben azonosítsa a tartalomhoz és a lekérdezésekhez használható beágyazási modellt. Ha nyers vektoradatokat és nyersvektor-lekérdezéseket biztosít, vagy ha a RAG-megoldás nem tartalmaz vektoradatokat, hagyja ki ezt a lépést.
A szöveg-vektor konverziós lépést tartalmazó vektoros lekérdezések ugyanazt a beágyazási modellt kell használniuk, amelyet az indexelés során használtak. A keresőmotor nem ad hibát, ha különböző modelleket használ, de gyenge eredményeket kap.
Az azonos modellre vonatkozó követelmény teljesítéséhez válassza a beágyazási modelleket, amelyek az indexelés során végzett jártasságokon és a lekérdezés végrehajtása során vektorizálókon keresztül hivatkozhatók. Az alábbi táblázat a képesség- és vektorizáló párokat sorolja fel. A beágyazási modellek felhasználási módjának megtekintéséhez ugorjon előre, és hozzon létre egy indexelési folyamatot olyan kódhoz, amely beágyazási képességet és egy megfelelő vektorizálót hív meg.
Az Azure AI Search készség- és vektorfejlesztői támogatást nyújt az alábbi beágyazási modellekhez az Azure-felhőben.
Ügyfél | Modellek beágyazása | Készség | Vektorizáló |
---|---|---|---|
Azure OpenAI | text-embedding-ada-002, text-embedding-3-large, text-embedding-3-small |
AzureOpenAIEmbedding | AzureOpenAIEmbedding |
Azure AI Képfelismerés | multimodális 4.0 1 | AzureAIVision | AzureAIVision |
Azure AI Foundry-modellkatalógus | Facebook-DinoV2-Image-Embeddings-ViT-Base, Facebook-DinoV2-Image-Embeddings-ViT-Giant, Cohere-embed-v3-english, Cohere-embed-v3-többnyelvű |
AML2 | Azure AI Foundry-modellkatalógus |
1 Támogatja a kép- és szövegvektorálást.
2 A modellkatalógusban üzembe helyezett modellek egy AML-végponton keresztül érhetők el. Ehhez a kapcsolathoz a meglévő AML-készséget használjuk.
Az itt felsorolt modelleken kívül más modelleket is használhat. További információ: Nem Azure-beli modellek használata beágyazásokhoz ebben a cikkben.
Feljegyzés
A beágyazási modellek bemenetei általában adattömbök. Az Azure AI Search RAG-mintában az adattömbkezelés az indexelő folyamatában történik, amely a sorozat egy másik oktatóanyagában található.
A generatív AI lekérdezési idején használt modelljeinek áttekintése
Az Azure AI Search nem rendelkezik csevegőmodellekhez használható integrációs kóddal, ezért olyan LLM-et kell választania, amelyet ismer, és amely megfelel a követelményeknek. A lekérdezési kódot úgy módosíthatja, hogy különböző modelleket próbáljon ki anélkül, hogy újra kellene építenie egy indexet, vagy újra kellene futtatnia az indexelési folyamat bármely részét. Tekintse át a Keresés elemet, és hozzon létre válaszokat a csevegőmodellt meghívó kódhoz.
Az alábbi modelleket gyakran használják csevegéses keresési élményhez:
Ügyfél | Csevegési modellek |
---|---|
Azure OpenAI | GPT-35-Turbo, GPT-4, GPT-4o, GPT-4 Turbo |
A GPT-35-Turbo és a GPT-4 modellek úgy vannak optimalizálva, hogy beszélgetésként formázott bemenetekkel működjenek.
Ebben az oktatóanyagban a GPT-4o-t használjuk. A tesztelés során megállapítottuk, hogy kevésbé valószínű a saját betanítási adatainak kiegészítése. Ha például "a föld mekkora részét borítja víz?", a GPT-35-Turbo a földről szóló beépített ismerete alapján azt válaszolta, hogy a föld 71%-át víz borítja, annak ellenére, hogy a mintaadatok nem adják meg ezt a tényt. Ezzel szemben, GPT-4o válaszolt (helyesen) a "Nem tudom".
Modellek üzembe helyezése és információk gyűjtése
A modelleket egy végponton keresztül kell üzembe helyezni és elérhetővé tenni. A beágyazással kapcsolatos készségeknek és a vektorizálóknak egyaránt szükségük van a dimenziók számára és a modell nevére.
Ez az oktatóanyag-sorozat a következő modelleket és modellszolgáltatókat használja:
- Text-embedding-3-large az Azure OpenAI-ban beágyazáshoz
- GPT-4o az Azure OpenAI-ban a csevegés befejezéséhez
A modellek Azure OpenAI-ban való üzembe helyezéséhez a Cognitive Services OpenAI-közreműködője vagy annál magasabb szintű közreműködője szükséges.
Nyissa meg az Azure AI Foundryt.
A bal oldali menüben válassza a Központi telepítések lehetőséget.
Válassza a Modell>üzembe helyezése alapmodellt.
A legördülő listából válassza a 3-nagy méretű szövegbe ágyazás lehetőséget, és erősítse meg a kijelölést.
Adja meg az üzembe helyezés nevét. Javasoljuk, hogy "text-embedding-3-large".
Fogadja el az alapértelmezett beállításokat.
Válassza az Üzembe helyezés lehetőséget.
Ismételje meg az előző lépéseket a gpt-4o esetében.
Jegyezze fel a modellneveket és a végpontot. A beágyazási képességek és a vektorizálók belsőleg állítják össze a teljes végpontot, így csak az erőforrás URI-ra van szüksége. Adott például az a végpont,
https://MY-FAKE-ACCOUNT.openai.azure.com/openai/deployments/text-embedding-3-large/embeddings?api-version=2024-06-01
amelyet a képesség- és vektorizáló-definíciókban meg kell adnia.https://MY-FAKE-ACCOUNT.openai.azure.com
A keresőmotor Azure-modellekhez való hozzáférésének konfigurálása
A folyamatok és lekérdezések végrehajtásához ez az oktatóanyag a Microsoft Entra-azonosítót használja hitelesítéshez és szerepkörökhöz az engedélyezéshez.
Rendelje hozzá saját magát és a keresési szolgáltatás identitásengedélyeit az Azure OpenAI-ban. Az oktatóanyag kódja helyileg fut. Az Azure OpenAI-kérések a rendszerből származnak. Emellett a keresőmotor keresési eredményeit az Azure OpenAI-nak is átadja a rendszer. Ezért Önnek és a keresési szolgáltatásnak is engedélyre van szüksége az Azure OpenAI-hoz.
Jelentkezzen be az Azure Portalra , és keresse meg a keresési szolgáltatást.
Az Azure AI Search konfigurálása rendszer által felügyelt identitás használatára.
Keresse meg az Azure OpenAI-erőforrást.
A bal oldali menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.
Válassza a Szerepkör-hozzárendelés hozzáadása lehetőséget.
Válassza a Felügyelt identitás lehetőséget, majd válassza a Tagok lehetőséget. Keresse meg a keresési szolgáltatás rendszer által felügyelt identitását a legördülő listában.
Ezután válassza a Felhasználó, csoport vagy szolgáltatásnév lehetőséget, majd válassza a Tagok lehetőséget. Keresse meg a felhasználói fiókját, majd válassza ki a legördülő listából.
Győződjön meg arról, hogy két biztonsági tag van hozzárendelve a szerepkörhöz.
Válassza a Véleményezés és hozzárendelés lehetőséget a szerepkör-hozzárendelések létrehozásához.
Az Azure AI Vision modelljeihez való hozzáféréshez rendelje hozzá a Cognitive Services OpenAI-felhasználót. Az Azure AI Foundry esetében rendelje hozzá az Azure AI Developert.
Nem Azure-beli modellek használata beágyazáshoz
A beágyazási modellek integrálásának mintája az, hogy egy egyéni képességbe és egyéni vektorizálóba burkoljuk. Ez a szakasz hivatkozásokat tartalmaz hivatkozási cikkekre. Ha egy nem Azure-beli modellt hív meg, tekintse meg az egyéni beágyazások bemutatóját.
Ügyfél | Modellek beágyazása | Készség | Vektorizáló |
---|---|---|---|
Bármelyik | Bármelyik | egyéni képesség | egyéni vektorizáló |