Megosztás a következőn keresztül:


Nulla lövéses és kevés lövéses tanulás

Ez a cikk a nulla lövéses tanulást és a kevés lövéses tanulást ismerteti a .NET gyors tervezéséhez, beleértve az elsődleges használati eseteket is.

A GPT-modell teljesítményének előnye a gyors tervezés, az utasítások és példák a modell számára történő pontosításának gyakorlata. A nulla lövéses tanulás és a kevés lövéses tanulás olyan technikák, amelyeket példákkal is szemléltethet.

A nulla lövésű tanulással a rendszer kéri, de nem verbatim befejezéseket. Olyan befejezéseket is megadhat, amelyek csak a végbírásokból állnak. A nulla lövésű tanulás teljes mértékben a modell meglévő tudására támaszkodik a válaszok létrehozásához, ami csökkenti a létrehozott jogkivonatok számát, és segít a költségek szabályozásában. A nulla lövésű tanulás azonban nem növeli a modell tudását.

Íme egy nulla lövésű példa, amely arra utasítja a modellt, hogy értékelje ki a felhasználói bemenetet, és állapítsa meg, hogy a bemenet négy lehetséges szándék közül melyiket jelöli, majd írja elő a válaszát a "Szándék: ".

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.
User Input: {request}
Intent: 
""";

Kevés lövéses tanulással a szó szerinti befejezésekkel párosított kéréseket is tartalmaz. A nulla lövésű tanuláshoz képest ez azt jelenti, hogy a kevés lövésű tanulás több jogkivonatot hoz létre, és a modell frissíti tudását, ami erőforrás-igényesebbé teheti a kevés lövésű tanulást. Ugyanebből az okból azonban a kevés lövésű tanulás is segít a modellnek relevánsabb válaszokat adni.

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.

User Input: Can you send a very quick approval to the marketing team?
Intent: SendMessage

User Input: Can you send the full update to the marketing team?
Intent: SendEmail

User Input: {request}
Intent:
""";

Nulla lövéses tanulási használati esetek

A nulla lövésű tanulás az a gyakorlat, hogy olyan kéréseket adnak át, amelyek nem párosulnak a szó szerinti befejezésekkel, bár párosíthatók egy jellel. A nulla lövésű tanuláshoz két elsődleges használati eset létezik:

  • Finomhangolt LLM-ek használata – Mivel a modell meglévő tudására támaszkodik, a nulla lövésű tanulás nem olyan erőforrás-igényes, mint a kevés lövéses tanulás, és jól működik azokkal az LLM-ekkel, amelyeket már finomhangoltak az utasítás-adathalmazokon. Lehet, hogy csak a nulla lövésű tanulásra támaszkodhat, és viszonylag alacsonyan tarthatja a költségeket.
  • Teljesítmény-alapkonfigurációk létrehozása – A nulla lövéses tanulással szimulálhatja, hogyan teljesítene az alkalmazás a tényleges felhasználók számára. Ez lehetővé teszi a modell aktuális teljesítményének különböző aspektusait, például a pontosságot vagy a pontosságot. Ebben az esetben általában nulla lövéses tanulással hoz létre egy teljesítménykonfigurációt, majd kísérletezik néhány lövéses tanulással a teljesítmény javítása érdekében.

Néhány lövéses tanulási használati esetek

A kevés képből álló tanulás az a gyakorlat, amely során a parancssorokat verbatim befejezésekkel (néhány képből álló kérésekkel) párosítva adhatja meg a modell válaszát. A nulla lövésű tanulástól eltérően a kevés lövéses tanulás is hozzáadható a modell tudásához. Akár saját adatkészletekkel is automatikusan létrehozhat néhány lövéses kérést a lekérésesen bővített generáció végrehajtásával.

A kevés lövésű tanulásnak két elsődleges felhasználási esete van:

  • LLM finomhangolása – Mivel a modell tudásához is hozzá tud adni, a kevés lövéses tanulás javíthatja a modell teljesítményét. Ez azt is eredményezi, hogy a modell több jogkivonatot hoz létre, mint a nulla lövésű tanulás, ami végül megfizethetetlenül költségessé vagy akár megvalósíthatatlanná válhat. Ha azonban az LLM még nincs finomhangolva, nem fog jó teljesítményt kapni nulla lövéses kérésekkel, és a kevés lövéses tanulás garantált.
  • Teljesítményproblémák elhárítása – A kevés lövéses tanulást a nulla lövésű tanulás folytatásaként használhatja. Ebben az esetben nulla lövéses tanulással állapítja meg a teljesítménybeli alapkonfigurációt, majd kísérletezzen néhány lövéses tanulással a használt nulla lövésű kérések alapján. Ez lehetővé teszi a modell tudásának hozzáadását, miután látta, hogy az aktuálisan hogyan reagál, így iterálhatja és javíthatja a teljesítményt, miközben minimalizálhatja a bevezetett tokenek számát.

Figyelmeztetések

  • A példaalapú tanulás nem működik jól az összetett érvelési feladatokhoz. Az utasítások hozzáadása azonban segíthet a probléma megoldásában.
  • A kevés lövéses tanuláshoz hosszadalmas utasításokat kell létrehozni. A nagy számú jogkivonattal rendelkező kérések növelhetik a számítást és a késést. Ez általában megnövekedett költségeket jelent. A kérések hosszának is van korlátja.
  • Ha több példát használ, a modell megtanulhat hamis mintákat, például "A hangulatok kétszer nagyobb valószínűséggel pozitívak, mint negatívak".