Megosztás a következőn keresztül:


Beágyazások a .NET-ben

A beágyazások az LLM-ekben rögzítik a szemantikai jelentést. Ezek a nem numerikus adatok numerikus ábrázolásai, amelyekkel az LLM meghatározhatja a fogalmak közötti kapcsolatokat. Beágyazásokkal segíthet egy AI-modellnek megérteni a bemenetek jelentését, hogy összehasonlításokat és átalakításokat hajtson végre, például összegezheti a szöveget, vagy képeket hozhat létre szövegleírásokból. Az LLM-ek azonnal használhatnak beágyazást, és a beágyazásokat vektoradatbázisokban is tárolhatja, hogy szükség szerint szemantikai memóriát biztosítson az LLM-ek számára.

Használati esetek beágyazásokhoz

Ez a szakasz a beágyazások fő használati eseteit sorolja fel.

Saját adatok használata a befejezési relevancia javítása érdekében

A saját adatbázisaival beágyazásokat hozhat létre az adatokhoz, és integrálhatja őket egy LLM-sel, hogy elérhetővé tegye őket a befejezésekhez. A beágyazások használata a lekéréses kiegészítésű generáció fontos összetevője.

A parancssorban elférő szöveg mennyiségének növelése

Beágyazásokkal növelheti a kérésekben elférő környezet mennyiségét anélkül, hogy növelné a szükséges jogkivonatok számát.

Tegyük fel például, hogy 500 oldalnyi szöveget szeretne belefoglalni egy üzenetbe. A sok nyers szöveghez tartozó tokenek száma meghaladja a bemeneti jogkivonatok korlátját, így nem lehet közvetlenül belefoglalni a parancssorba. A beágyazásokkal nagy mennyiségű szöveget összegzhet és oszthat fel olyan darabokra, amelyek elég kicsik ahhoz, hogy elférjenek egy bemenetben, majd felmérje az egyes részek és a teljes nyers szöveg hasonlóságát. Ezután kiválaszthatja azt a darabot, amely a legjobban megőrzi a nyers szöveg szemantikai jelentését, és a jogkivonat korlátjának átlépése nélkül használhatja azt az üzenetben.

Szövegbesorolás, összegzés vagy fordítás végrehajtása

Beágyazásokkal segít a modellnek megérteni a szöveg jelentését és kontextusát, majd osztályozni, összegezni vagy lefordítani a szöveget. Beágyazásokkal például segíthet a modelleknek a szövegek pozitív vagy negatívként, levélszemétként vagy nem levélszemétként, illetve hírekként vagy véleményként való besorolásában.

Hang létrehozása és átírása

Hangbeágyazással feldolgozhat hangfájlokat vagy bemeneteket az alkalmazásban.

A Speech service például számos hangbeágyazást támogat, beleértve a beszédet szöveggé és szövegről beszédre. A hangokat valós időben vagy kötegekben is feldolgozhatja.

Szöveg átalakítása képekké vagy képekké szöveggé

A szemantikus képfeldolgozáshoz képbeágyazások szükségesek, amelyeket a legtöbb LLM nem tud létrehozni. Képbeágyazási modell( például ViT ) használatával vektoros beágyazást hozhat létre képekhez. Ezután ezeket a beágyazásokat képgenerálási modellel használhatja képek szöveggel történő létrehozására vagy módosítására, vagy fordítva. Használhatja például a DALL· E modell képek, például emblémák, arcok, állatok és tájképek létrehozásához .

Kód létrehozása vagy dokumentálása

A beágyazásokkal a modell kódot hozhat létre szövegből vagy fordítva, különböző kód- vagy szövegkifejezések közös ábrázolássá alakításával. Beágyazásokkal például segíthet a modellnek C# vagy Python nyelven történő létrehozásában vagy dokumentálásában.

Beágyazási modell kiválasztása

Beágyazásokat hozhat létre a nyers adatokhoz egy AI-beágyazási modell használatával, amely a nem numerikus adatokat vektorba (számok hosszú tömbjébe) kódolhatja. A modell olyan nem numerikus adatokba való beágyazást is képes dekódolni, amelyek jelentése megegyezik vagy hasonló az eredeti, nyers adatokéval. Számos beágyazási modell érhető el, az OpenAI modellje text-embedding-ada-002 pedig a használt gyakori modellek egyike. További példákért tekintse meg az Azure OpenAI-ban elérhető beágyazási modellek listáját.

Beágyazások tárolása és feldolgozása vektoradatbázisban

Miután létrehozott beágyazásokat, szüksége lesz egy mód arra, hogy tárolja őket, hogy később lekérhesse őket egy LLM-hez intézett hívásokkal. A vektoradatbázisok vektorok tárolására és feldolgozására lettek tervezve, így természetes otthont jelentenek a beágyazásoknak. A különböző vektoradatbázisok különböző feldolgozási képességeket kínálnak, ezért a nyers adatok és a célok alapján érdemes választania egyet. A lehetőségekről további információt az elérhető vektoradatbázis-megoldásokban talál.

Beágyazások használata az LLM-megoldásban

LLM-alapú alkalmazások létrehozásakor a Szemantic Kernel használatával integrálhatja a beágyazási modelleket és a vektortárolókat, így gyorsan lekérheti a szöveges adatokat, és beágyazásokat hozhat létre és tárolhat. Így vektoradatbázis-megoldással tárolhatja és lekérheti a szemantikai emlékeket.