Hatékony Genie-tér curate
A Genie-tér kialakításának célja egy olyan környezet létrehozása, ahol az üzleti felhasználók természetes nyelvi kérdéseket tehetnek fel, és pontos, konzisztens válaszokat kaphatnak az adataik alapján. A genie-terek fejlett modelleket használnak, amelyek kifinomult lekérdezéseket hoznak létre, és általános világismereteket ismernek.
A legtöbb üzleti kérdés tartományspecifikus, ezért az űrkurátor szerepe az, hogy áthidalja az általános világismeret és az adott tartományban vagy egy adott vállalat által használt speciális nyelv közötti szakadékot. A kurátorok metaadatokkal és útmutatásokkal segítik a Genie-t az üzleti felhasználók kérdéseinek pontos értelmezésében és megválaszolásában. Ez a cikk az ajánlott eljárásokat és alapelveket ismerteti, amelyek a sikeres tér kialakításához vezetnek.
Ajánlott eljárások új terület meghatározásához
A következő szakaszok ajánlott eljárások a hatékony hely létrehozásához.
Kicsi kezdés
A Genie-tér kurálása iteratív folyamat. Új hely létrehozásakor kezdje a lehető legkisebbre, minimális útmutatással és a megválaszolandó kérdések korlátozott készletével. Ezután hozzáadhatja az iterációt a visszajelzés és a figyelés alapján. Ez a megközelítés leegyszerűsíti a tér létrehozását és karbantartását, és lehetővé teszi, hogy hatékonyan, a valós felhasználói igényeknek megfelelően hatékonyan gyógyítsa azt.
A következő irányelvek segítségével hozhat létre egy kis dzsinn-helyet:
- Koncentráljon: Csak azokat a táblákat foglalja bele, amelyek szükségesek a hely által kezelni kívánt kérdések megválaszolásához. Törekedjen öt vagy kevesebb táblára. Minél jobban koncentrált a kiválasztás, annál jobb. Az ideális adatkezelési tér szorosan fókuszál egy kis adatmennyiségre, ezért korlátozza a táblázataiban a oszlopok számát.
- Tervezze meg aiterálását: Kezdje a hely minimális beállításával, az alapvető táblákra és az alapvető utasításokra összpontosítva. Adjon hozzá részletesebb útmutatást és példákat a tér idővel történő finomítása során, ahelyett, hogy eredetileg a tökéletességre törekedett.
- Építés jól annotált táblákra: A Genie a Unity Catalog oszlopneveit és leírásait használja a válaszok generálásához. Világos oszlopnevek és leírások segítenek kiváló minőségű válaszok előállításában. Az oszlopleírásoknak pontos környezeti információkat kell nyújtaniuk. Kerülje a kétértelmű vagy szükségtelen részleteket. Ellenőrizze az AI által létrehozott leírásokat a pontosság és az egyértelműség szempontjából, és csak akkor használja őket, ha azok megfelelnek a manuálisan megadottaknak.
Adjon meg tartományszakértőt a terület meghatározásához
A hatékony tér létrehozójának meg kell értenie az adatokat és az abból kinyerhető megállapításokat. Az SQL-ben jártas adatelemzők általában rendelkeznek a tér curához szükséges ismeretekkel és készségekkel.
A tér céljának meghatározása
A tér adott célközönségének és céljának azonosítása segít eldönteni, hogy mely adatokat, utasításokat és tesztkérdéseket érdemes használni. A térnek egy adott témakörre és közönségre vonatkozó kérdésekre kell válaszolnia, nem pedig a különböző tartományok általános kérdéseire.
Tesztelés és beállítás
Önnek kell lennie a hely első felhasználójának. Miután létrehozott egy új helyet, kezdjen el kérdéseket feltenni. Gondosan vizsgálja meg a kérdésekre válaszul létrehozott SQL-t. Ha a Genie félreértelmezi az adatokat, a kérdéseket vagy az üzleti zsargont, a létrehozott SQL szerkesztésével vagy más konkrét utasítások megadásával beavatkozhat. Tartsa a tesztelést és a szerkesztést, amíg megbízható válaszokat nem kap.
Miután áttekintett egy kérdést, hozzáadhatja azt viszonyítási kérdésként, amellyel szisztematikusan tesztelheti és értékelheti a helyet az általános pontosság érdekében. A Dzsinn válaszainak teszteléséhez különböző változatokat és különböző kérdéseket is használhat. Lásd: Teljesítménytesztek használata Genie-térben.
A hibás válaszok kijavításával kapcsolatos ötletek hibaelhárítása című témakörben talál további információt.
Felhasználói tesztelés végrehajtása
Miután tesztelte a válaszminőséget, toborozjon egy üzleti felhasználót a Genie-tér kipróbálásához. Az alábbi irányelveket követve zökkenőmentes felhasználói folyamatot biztosíthat, és visszajelzést kaphat a folyamatos fejlesztésről:
- Állítsa be az elvárásokat, hogy a feladatuk segíteni a szoba finomításában.
- Kérje meg őket, hogy a tesztelésüket az adott témakörre összpontosítsák, és a tér által megválaszolandó kérdésekre.
- Ha helytelen választ kapnak, arra bátorítsa a felhasználókat, hogy további utasításokat és pontosításokat adjanak a csevegéshez a válasz pontosítása érdekében. Ha megfelelő választ adnak, a végső lekérdezést fel kell venniük, hogy minimalizálják a hasonló hibákat a jövőbeni interakciók során.
- Kérje meg a felhasználókat, hogy a beépített visszajelzési mechanizmussal felosztják vagy leosztják a válaszokat.
- Kérd meg a felhasználókat, hogy osszanak meg további visszajelzéseket és megoldatlan kérdéseket közvetlenül a tér szerzőivel. A szerzők és szerkesztők visszajelzésekkel pontosíthatják az utasításokat, példákat és megbízható eszközöket.
Fontolja meg, hogy képzési anyagokat vagy írásos dokumentumot biztosítson a helyiség teszteléséhez és visszajelzéséhez. Ahogy az üzleti felhasználók tesztelik a helyet, az Előzmények lapon megjelennek a feltett kérdések. A genie helyes értelmezéséhez további útmutatást adhat a kérdések és adatok pontos értelmezéséhez. A Genie-terek monitorozásáról további információt az Előzmények áttekintése és visszajelzések című témakörben talál.
Feljegyzés
Az üzleti felhasználóknak az eredeti munkaterület tagjainak kell lenniük a hely eléréséhez. Tekintse meg a szükséges engedélyeket , amelyekből megtudhatja, hogyan biztosíthat megfelelő engedélyeket a területtel való interakcióhoz.
Hibaelhárítás
A következő szakaszok a gyakori problémák megoldását ismertetik.
Félreértett üzleti zsargon
A legtöbb vállalat vagy tartomány konkrét rövidítést használ az üzleti eseményekről való kommunikációhoz. Ha például egy évre hivatkozik, az mindig a pénzügyi évet jelentheti, és ez a pénzügyi év január helyett februárban vagy márciusban kezdődhet. Annak érdekében, hogy Genie természetes módon és pontosan válaszolhasson ezekre a kérdésekre, olyan utasításokat tartalmazzon, amelyek kifejezetten megfeleltetik az üzleti zsargont olyan szavakhoz és fogalmakhoz, amelyeket Genie megérthet. Lásd: Utasítások megadása.
Helytelen tábla- vagy oszlophasználat
Ha Genie helytelen táblából próbál adatokat lekérni, vagy helytelen oszlopokon futtat elemzést, az alábbi módokon módosíthatja az adatokat:
- Adjon meg egyértelmű és pontos leírásokat: Ellenőrizze a táblákat és a kapcsolódó metaadatokat annak ellenőrzéséhez, hogy az ott használt terminológia megegyezik-e a felhasználók által a beküldött kérdések terminológiájában. Ha nem, pontosítsa a leírást, vagy adjon hozzá egy utasítást, amely megfelelteti a táblázatban használt terminológiát a kérdésben használt terminológiának.
- Példa lekérdezések hozzáadása: Adjon meg minta SQL-lekérdezéseket, amelyekkel Genie meg tudja tanulni, hogyan válaszolhat bizonyos kérdésekre. Lásd: Utasítások megadása.
- Táblák vagy oszlopok eltávolítása a térből: Egyes táblák olyan átfedésben lévő oszlopokat vagy fogalmakat tartalmazhatnak, amelyek megnehezítik a Genie számára a válaszban használandó adatok megismerését. Ha lehetséges, távolítsa el a szükségtelen vagy átfedésben lévő táblákat vagy oszlopokat. Érdemes lehet olyan nézetet létrehozni, amely csak a szükséges oszlopokat tartalmazza.
Szűrési hibák
A generált lekérdezések gyakran tartalmaznak egy záradékot WHERE
, amely egy adott érték alapján szűri az eredményeket. Mivel a Genie nem rendelkezik a tényleges adatokkal, előfordulhat, hogy a WHERE
záradékot úgy állítja be, hogy helytelen értékre szűrjön. Előfordulhat például, hogy megpróbál megegyezni a "California" névvel, ha a tábla olyan rövidítéseket használ, mint a "CA".
Az ilyen helyzetekben próbálkozzon az alábbi stratégiák egyikével:
- Ha az oszlopértékek halmaza viszonylag kicsi, számba kell adnia az egyes oszlopleírások érvényes sztringeit. Idézőjeleket helyezhet a sztringértékek köré, különösen akkor, ha szóközök vagy számok vannak bennük. A gyakori enumerálásokhoz néha elég azt mondani, hogy "Használja a hárombetűs ország ISO-kódját" ahelyett, hogy minden állapotértéket felsorol.
Helytelen illesztések
Ha a Unity-katalógusban nincsenek megadva idegenkulcs-hivatkozások, előfordulhat, hogy a rendszer nem tudja, hogyan kell összekapcsolni a különböző táblákat.
Próbálkozzon az alábbi megoldások valamelyikének implementálásával:
- Ha lehetséges, adjon meg idegenkulcs-hivatkozásokat a Unity-katalógusban. Lásd CONSTRAINT záradék.
- Adjon meg példaként olyan lekérdezéseket, ahol a táblákat standard módon illeszti össze.
- Ha a táblák idegenkulcs-kapcsolatai nincsenek megadva a Unity-katalógusban, dokumentálja őket az utasításokban.
Ha ezek egyike sem oldja meg a problémát, akkor a táblázatot előre illesztse be egy nézetbe, és használja inkább a szóköz bemeneteként. Ez a stratégia az olyan összetettebb illesztések esetében hasznos, mint az öncsatlakozások.
Metrikaszámítási problémák
A metrikák számításának és feltekerésének módja tetszőlegesen bonyolult lehet, és számos olyan üzleti részletet foglal magában, amelyeket a terület nem ért. Ez helytelen jelentéskészítéshez vezethet.
Próbálkozzon az alábbi megoldások valamelyikének implementálásával:
- Ha a metrikák az alaptáblákból vannak összesítve, adjon meg példa SQL-lekérdezéseket az egyes összesítő értékek kiszámításához.
- Ha a metrikák előre ki lettek számítva, és összesített táblákban találhatók, ezt a táblázat megjegyzéseiben ismertesse. Adjon meg érvényes összesítéseket az egyes metrikákhoz, ha a táblában lévő metrikák tovább összesíthetők.
- Ha a létrehozni kívánt SQL nagyon bonyolult, próbáljon meg olyan nézeteket létrehozni, amelyek már összesítik a metrikákat az Ön területére.
Helytelen időalapú számítások
Előfordulhat, hogy a Genie nem mindig tudja kikövetkézíteni az adatokban vagy az elemzés végrehajtásának időzónájában képviselt időzónát, hacsak nem ad külön útmutatást.
Adjon meg explicitebb utasításokat az eredeti forrás időzónára, az átalakítási függvényre és a cél időzónára vonatkozóan. Az alábbi példák bemutatják, hogyan módosíthatja az általános utasításokat a megbízhatóbb időzónás konverziókhoz:
-
Mindig alakítsa át az időket egy adott időzónára: Ebben a példában tegyük fel, hogy a forrás időbélyege
UTC
, és azAmerica/Los_Angeles
időzónában szeretne eredményeket kapni. Adja hozzá az alábbiakat az utasításokhoz, és cserélje le a<timezone-column>
-t a megfelelő oszlopnévre:- A táblázatok időzónái a
UTC
formátumban vannak megadva. - Konvertálja az összes időzónát a következő függvény használatával:
convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>)
.
- A táblázatok időzónái a
-
UTC-n kívüli időpontformátumok konvertálása UTC-re: Ha a munkaterület alapértelmezett időzónája
UTC
, de a Los Angeles-i felhasználóknak ma egy adott rekordkészletre hivatkozniuk kell, adja hozzá a következőket a hely általános utasításaihoz:- A hivatkozásához használja a következőt: `date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))`
További részletekért és szintaxisért lásd convert_timezone függvény.
Utasítások figyelmen kívül hagyása
Még ha magyarázatokkal látta is el a táblázatokat és oszlopokat a megjegyzésekben, és általános utasításokat adott, előfordulhat, hogy a környezet még mindig nem használja őket megfelelően.
Próbálkozzon az alábbi stratégiák valamelyikével:
- Adjon meg példákat a táblákat helyesen használó lekérdezésekre. A példaként szolgáló lekérdezések különösen hatékonyan tanítják meg a helyet az adatok használatára.
- Olyan nézeteket hozhat létre a táblákból, amelyek egyszerűbb képet nyújtanak az adatokról.
- Tekintse át az utasításokat, és próbálja meg fókuszba helyezni a helyet az irreleváns táblák vagy utasítások eltávolításával.
- Próbáljon meg új csevegést indítani. A korábbi interakciók befolyásolhatják Genie válaszait egy adott csevegésben, de egy új csevegés indítása üres kiindulópontot ad az új utasítások teszteléséhez.
Teljesítményproblémák
Amikor a Genie-nek kivételesen hosszú lekérdezéseket vagy szöveges válaszokat kell létrehoznia, a válaszadás elhúzódhat, vagy akár a folyamat közben lejárhat az idő.
A teljesítmény javítása érdekében próbálkozzon az alábbi műveletekkel:
- Összetett lekérdezések beágyazásához használjon megbízható objektumokat vagy nézeteket. Lásd: Megbízható objektumok használata AI-/BI Genie-szóközökben.
- Ha lehetséges, csökkentse a példa SQL-lekérdezések hosszát.
- Új csevegés indítása, ha a Genie lassú vagy sikertelen válaszokat kezd generálni.
Megbízhatatlan válaszok a kritikus fontosságú kérdésekre
Megbízható eszközök használatával ellenőrzött válaszokat adhat azokra a kérdésekre, amelyeket a felhasználóktól elvár. Lásd: Megbízható objektumok használata AI-/BI Genie-szóközökben.
Tokenkorlát-figyelmeztetés
A tokenek a Dzsinn által a nyelv feldolgozására és megértésére használt alapvető szöveges egységek. A Genie-térben utasításokként vagy metaadatokként szereplő szöveg jogkivonatokká alakul. Ha a térben lévő tokenek száma megközelíti a korlátot, a termék figyelmeztetésekkel értesíti Önt. A Genie intelligens kontextusszűrést alkalmaz a metaadatokat képviselő tokenek és a Genie-tér egyes utasítástípusainak kiválasztásához. Még ha túllépi is a korlátot, a térnek továbbra is válaszokat kell adnia a kérdésekre.
Ha a Genie-tér megközelíti a token korlátját, a Genie priorizálhatja, hogy csak a táblaséma azon részeit és utasításokat foglalja bele, amelyek a leginkább relevánsak a kérdés szempontjából. Ez csökkentheti a válaszminőséget, ha a fontos környezetek szűrve lesznek. Fontolja meg a következő eljárásokat a jogkivonatok számának csökkentéséhez:
- Szükségtelen oszlopok eltávolítása: A táblák szükségtelen oszlopai jelentősen hozzájárulhatnak a tokenhasználathoz. Hozzon létre nézeteket, hogy kizárja a redundáns vagy nem alapvető mezőket a nyers táblákból.
-
Az oszlopok leírásának egyszerűsítése: Bár az oszlopleírások fontosak, kerülje az oszlopnevek által már továbbított információk duplikálását. Ha például egy oszlop neve
account_name
, az „az Ön fiókjának neve” leírás redundánsnak tűnhet, és kihagyható. - Utasítások egyszerűsítése: Ellenőrizze, hogy az utasítások egyértelműek és tömörek-e. Kerülje a felesleges szavakat.
- Metszett példa SQL-utasítások: Tartalmazzon a különböző típusú kérdéseket lefedő változatos SQL-utasításokat, de távolítsa el azokat, amelyek átfedők vagy redundánsak.
A fiókja nincs engedélyezve a földrajzi keresztirányú feldolgozáshoz
A Genie az Azure Databricks által felügyelt kijelölt szolgáltatás . A kijelölt szolgáltatások a Databricks Geos használatával kezelik az adattárolást. Egyes régiókban az adatok nem dolgozhatók fel ugyanabban a Geo-régióban, mint a munkaterület. Ha a munkaterület ezen régiók valamelyikében található, akkor a fiókadminisztrátornak engedélyeznie kell a térinformatikai feldolgozást .
Átviteli sebesség korlátainak elérése
A Genie-terek átviteli sebessége munkaterületenként percenként 20 kérdésre korlátozódik, az összes Genie-helyen.