Beágyazások a .NET-ben

Cikk
05/21/2024

A beágyazások az LLM-ekben rögzítik a szemantikai jelentést. Ezek a nem numerikus adatok numerikus ábrázolásai, amelyekkel az LLM meghatározhatja a fogalmak közötti kapcsolatokat. Beágyazásokkal segíthet egy AI-modellnek megérteni a bemenetek jelentését, hogy összehasonlításokat és átalakításokat hajtson végre, például összegezheti a szöveget, vagy képeket hozhat létre szövegleírásokból. Az LLM-ek azonnal használhatnak beágyazást, és a beágyazásokat vektoradatbázisokban is tárolhatja, hogy szükség szerint szemantikai memóriát biztosítson az LLM-ek számára.

Használati esetek beágyazásokhoz

Ez a szakasz a beágyazások fő használati eseteit sorolja fel.

Saját adatok használata a befejezési relevancia javítása érdekében

A saját adatbázisaival beágyazásokat hozhat létre az adatokhoz, és integrálhatja őket egy LLM-sel, hogy elérhetővé tegye őket a befejezésekhez. A beágyazások használata a lekéréses kiegészítésű generáció fontos összetevője.

A parancssorban elférő szöveg mennyiségének növelése

Beágyazásokkal növelheti a kérésekben elférő környezet mennyiségét anélkül, hogy növelné a szükséges jogkivonatok számát.

Tegyük fel például, hogy 500 oldalnyi szöveget szeretne belefoglalni egy üzenetbe. A sok nyers szöveghez tartozó tokenek száma meghaladja a bemeneti jogkivonatok korlátját, így nem lehet közvetlenül belefoglalni a parancssorba. A beágyazásokkal nagy mennyiségű szöveget összegzhet és oszthat fel olyan darabokra, amelyek elég kicsik ahhoz, hogy elférjenek egy bemenetben, majd felmérje az egyes részek és a teljes nyers szöveg hasonlóságát. Ezután kiválaszthatja azt a darabot, amely a legjobban megőrzi a nyers szöveg szemantikai jelentését, és a jogkivonat korlátjának átlépése nélkül használhatja azt az üzenetben.

Szövegbesorolás, összegzés vagy fordítás végrehajtása

Beágyazásokkal segít a modellnek megérteni a szöveg jelentését és kontextusát, majd osztályozni, összegezni vagy lefordítani a szöveget. Beágyazásokkal például segíthet a modelleknek a szövegek pozitív vagy negatívként, levélszemétként vagy nem levélszemétként, illetve hírekként vagy véleményként való besorolásában.

Hang létrehozása és átírása

Hangbeágyazással feldolgozhat hangfájlokat vagy bemeneteket az alkalmazásban.

A Speech service például számos hangbeágyazást támogat, beleértve a beszédet szöveggé és szövegről beszédre. A hangokat valós időben vagy kötegekben is feldolgozhatja.

Szöveg átalakítása képekké vagy képekké szöveggé

A szemantikus képfeldolgozáshoz képbeágyazások szükségesek, amelyeket a legtöbb LLM nem tud létrehozni. Képbeágyazási modell( például ViT ) használatával vektoros beágyazást hozhat létre képekhez. Ezután ezeket a beágyazásokat képgenerálási modellel használhatja képek szöveggel történő létrehozására vagy módosítására, vagy fordítva. Használhatja például a DALL· E modell képek, például emblémák, arcok, állatok és tájképek létrehozásához .

Kód létrehozása vagy dokumentálása

A beágyazásokkal a modell kódot hozhat létre szövegből vagy fordítva, különböző kód- vagy szövegkifejezések közös ábrázolássá alakításával. Beágyazásokkal például segíthet a modellnek C# vagy Python nyelven történő létrehozásában vagy dokumentálásában.

Beágyazási modell kiválasztása

Beágyazásokat hozhat létre a nyers adatokhoz egy AI-beágyazási modell használatával, amely a nem numerikus adatokat vektorba (számok hosszú tömbjébe) kódolhatja. A modell olyan nem numerikus adatokba való beágyazást is képes dekódolni, amelyek jelentése megegyezik vagy hasonló az eredeti, nyers adatokéval. Számos beágyazási modell érhető el, az OpenAI modellje text-embedding-ada-002 pedig a használt gyakori modellek egyike. További példákért tekintse meg az Azure OpenAI-ban elérhető beágyazási modellek listáját.

Beágyazások tárolása és feldolgozása vektoradatbázisban

Miután létrehozott beágyazásokat, szüksége lesz egy mód arra, hogy tárolja őket, hogy később lekérhesse őket egy LLM-hez intézett hívásokkal. A vektoradatbázisok vektorok tárolására és feldolgozására lettek tervezve, így természetes otthont jelentenek a beágyazásoknak. A különböző vektoradatbázisok különböző feldolgozási képességeket kínálnak, ezért a nyers adatok és a célok alapján érdemes választania egyet. A lehetőségekről további információt az elérhető vektoradatbázis-megoldásokban talál.

Beágyazások használata az LLM-megoldásban

LLM-alapú alkalmazások létrehozásakor a Szemantic Kernel használatával integrálhatja a beágyazási modelleket és a vektortárolókat, így gyorsan lekérheti a szöveges adatokat, és beágyazásokat hozhat létre és tárolhat. Így vektoradatbázis-megoldással tárolhatja és lekérheti a szemantikai emlékeket.

Megosztás a következőn keresztül:

Beágyazások a .NET-ben

Használati esetek beágyazásokhoz

Saját adatok használata a befejezési relevancia javítása érdekében

A parancssorban elférő szöveg mennyiségének növelése

Szövegbesorolás, összegzés vagy fordítás végrehajtása

Hang létrehozása és átírása

Szöveg átalakítása képekké vagy képekké szöveggé

Kód létrehozása vagy dokumentálása

Beágyazási modell kiválasztása

Beágyazások tárolása és feldolgozása vektoradatbázisban

Beágyazások használata az LLM-megoldásban

További források

Megosztás a következőn keresztül:

Beágyazások a .NET-ben

Használati esetek beágyazásokhoz

Saját adatok használata a befejezési relevancia javítása érdekében

A parancssorban elférő szöveg mennyiségének növelése

Szövegbesorolás, összegzés vagy fordítás végrehajtása

Hang létrehozása és átírása

Szöveg átalakítása képekké vagy képekké szöveggé

Kód létrehozása vagy dokumentálása

Beágyazási modell kiválasztása

Beágyazások tárolása és feldolgozása vektoradatbázisban

Beágyazások használata az LLM-megoldásban

Kapcsolódó tartalom

További források