Mi az AI/BI Genie-terület?
Ez a cikk bemutatja az AI/BI Genie szolgáltatást, amely egy Azure Databricks-funkció, amellyel az üzleti csapatok természetes nyelven kezelhetik az adataikat. A szervezet terminológiájára és adataira szabott generatív AI-t használ, amely lehetővé teszi a teljesítmény monitorozását és finomítását a felhasználói visszajelzések segítségével.
Áttekintés
A tartományi szakértők, például az adatelemzők, adathalmazokkal, minta lekérdezésekkel és szöveges irányelvekkel konfigurálják a Genie-tereket, hogy segítsenek a Genie-nek üzleti kérdéseket elemzési lekérdezésekké alakítani. A beállítás után az üzleti felhasználók kérdéseket tehetnek fel, és vizualizációkat hozhatnak létre a működési adatok megértéséhez. Folyamatosan frissítheti Genie szemantikai tudását az adatok változásakor, és a felhasználók új kérdéseket tehetnek fel. További információ a DatabricksIQ-ról: DatabricksIQ-alapú funkciók.
Az AI/BI Genie a jegyzetekkel ellátott táblákból és oszlopokból kiválasztja a megfelelő neveket és leírásokat a természetes nyelvi kérdések egyenértékű SQL-lekérdezéssé alakításához. Ezután a létrehozott lekérdezéssel és eredménytáblával válaszol, ha lehetséges. Ha Genie nem tud választ adni, feltehet további kérdéseket, hogy tisztázza a választ, mielőtt választ ad.
Példák az alkalmazási helyzetekre
Különböző Genie-tereket hozhat létre a különböző nem technikai célközönségek kiszolgálásához. Az alábbi forgatókönyvek két lehetséges használati esetet írnak le.
1. példa: Lehetőség állapotának megjelenítése
Egy értékesítési vezető a nyitott és lezárt lehetőségek aktuális állapotát szeretné szakaszonként lekérni az értékesítési folyamatában. Természetes nyelv használatával kommunikálhatnak a Genie-térrel, és automatikusan vizualizációt hozhatnak létre.
Az alábbi gif a következő interakciót mutatja be:
2. példa: A logisztika nyomon követése
Egy logisztikai vállalat Genie-terek használatával szeretné segíteni a különböző részlegek üzleti felhasználóit a működési és pénzügyi adatok nyomon követésében. Egy Genie-helyet állítottak fel a szállítási létesítmény vezetőinek a szállítmányok nyomon követésére, egy másik pedig a pénzügyi vezetők számára, hogy megértsék a pénzügyi állapotukat.
Hogyan generálja a Genie a választ?
Genie egy összetett AI-rendszert használ, az üzleti kérdések értelmezéséhez és válaszok létrehozásához. Egyetlen nagy nyelvi modell használata helyett összetett AI-rendszerek dolgozzák fel a feladatokat az AI-alkalmazásokban több interakciós összetevő kombinálásával. Az összetett AI-rendszerek a teljesítményük és rugalmasságuk miatt egyre gyakoribb tervezési mintát jelentenek az AI-alkalmazásokban. További információért lásd: A modellekről az összetett MI rendszerekre való áttérés.
Amikor egy felhasználó kérdést küld, Genie elemzi a kérést, azonosítja a releváns adatforrásokat, és meghatározza, hogyan válaszolhat a kérdésre. Az Ön által megadott utasítások a Unity Catalog metaadataival kombinálva lehetővé teszik a Genie számára, hogy üzleti és technikai logikát is kikövetkeztetjen. A Genie intelligensen szűri a példa SQL-lekérdezéseket, a tábla- és oszlop metaadatait és a csevegési előzményeket, hogy a kérés megválaszolásához a legrelevánsabb információkat választhassa ki.
A Genie a következő összetevőket használja a válaszok létrehozásához:
- tábla metaadatainak: Táblázatneveket, leírásokat és meghatározott elsődleges kulcsot (PK) és idegenkulcs-kapcsolatokat (FK) tartalmaz. A Genie ezeket az adatokat használja a kérés elemzésekor, és a természetes nyelvi kérést SQL-vé alakítja.
- Oszlopnevek és -leírások: A Genie intelligensen szűri a releváns oszlopneveket és leírásokat, hogy azokat beilleszthesse.
- SQL példa-lekérdezések: A Genie intelligensen kiválasztja a releváns SQL-példákat az Utasításokból.
- SQL-függvények: A térben hozzáadott összes SQL-függvény.
- utasítások: A Általános utasítások szövegként megadott egyszerű szöveges jegyzetek kontextusként szerepelnek.
- Parancssori és válaszelőzmények: Az aktuális csevegésből érkező kérések és válaszok kontextusként jelennek meg. Ha szükséges, a token korlátokbeállítása miatt a csevegési rekord legrégebbi részei kizárásra kerülnek.
Feljegyzés
Bizonyos táblázatadatok, például a tulajdonos és a tábla mérete alapértelmezés szerint nem szerepelnek a táblázatban. Az információk eléréséhez használja az összes Unity-katalógushoz elérhető információs sémából származó nézeteket. Az alapértelmezett nézetek szükségtelen részleteket is tartalmazhatnak, így egyéni nézet létrehozása segíthet a szükséges információkra összpontosítani. Az információs sémában elérhető információkról további információt az Információs sémacímű témakörben talál.
Ha a Genie eredményül ad vissza egy lekérdezést, az a kijelölt SQL Warehouse-on fut. Az újrapróbálkozások kezelése automatikusan megtörténik, az SQL Warehouse pedig az egyidejűséget és a skálázást kezeli.
Milyen adatokat használjak?
A Genie-tér a Unity Catalogban regisztrált adatokon alapul, beleértve a felügyelt táblákat, külső táblákat, idegen táblákat, nézeteket és materializált nézeteket. Az AI/BI Genie a Unity Catalog-objektumokhoz csatolt metaadatokat használja a válaszok létrehozásához. A jól jegyzett adathalmazok, amelyeket az Ön által megadott utasításoknak megfelelően adnak meg, kulcsfontosságúak ahhoz, hogy pozitív élményt teremtsen a végfelhasználók számára.
A Databricks a következőket javasolja:
- Elemzési felhasználás adatainak lekontúrása: Rétegnézetek az oszlopok számának csökkentése érdekében, valamint használati esetspecifikus információk hozzáadása a válaszminőség növeléséhez.
- Minimalizálja a Genie térben lévő táblák és oszlopok számát: Csak azokat a táblákat és oszlopokat vegye fel, amelyek szükségesek egy adott tartomány kérdéseinek megválaszolásához. A szükségtelen táblák vagy oszlopok miatt a Genie zavaró vagy helytelen válaszokat adhat, vagy hibaüzenetet jeleníthet meg.
- Elsődleges kulcs (PK)/idegen kulcs (FK) kapcsolatok definiálása: A Unity Catalog segítségével definiálhat PK-/FK-kapcsolatokat, hogy a Genie megértse az adatok közti kapcsolatokat.
Fájlfeltöltések
Fontos
Ez a funkció nyilvános előzetes verzióban van.
A felhasználók saját kis adatfájlokat is feltölthetnek egy Genie-helyre. A fájlfeltöltés engedélyezéséhez forduljon a Databricks-fiók csapatához. További információ: Fájl feltöltése.
Megbízható eszközök
A megbízható eszközök további biztosítéki réteget nyújtanak az eredmény pontosságában egy helyfelhasználó számára. Ha egy paraméteres példa-lekérdezés vagy SQL-függvény pontos szövegét használja a válasz létrehozásához, a Genie a választ megbízható objektumként jelöli meg. Lásd: Megbízható objektumok használata AI-/BI Genie-szóközökben.
Csevegések
A legtöbb Genie-tér interakció egy csevegőablakban történik. A csevegési szálak az egyes felhasználók interakcióinak rekordját menti. Minden csevegési szál fenntartja a korábbi kérdések kontextusát. Genie a beszélgetési előzmények kontextusával tanulja meg, hogy a felhasználók követési kérdéseket tegyenek fel az eredményhalmaz további feltárásához vagy újrafókuszásához.
Azok a felhasználók, akik legalább megtekintési hozzáféréssel rendelkeznek egy térhez, megtekinthetik a saját csevegési előzményeiket. A legalább SZERKESZTHETŐ jogosultsággal rendelkező felhasználók áttekinthetik a szekció Előzmények lapján az összes kérdést és választ.
Válaszok áttekintése
A legtöbb válasz tartalmaz egy természetes nyelvű magyarázatot és egy táblázatot, amely a releváns eredményhalmazt mutatja. A forrástáblák a magyarázat alatt jelennek meg, és az eredmények létrehozásához használt SQL-lekérdezés a válasz részletei között érhető el. Ha egy vizualizáció javítaná a tisztánlátást, a Genie tartalmaz egyet. Az egyes válaszok struktúrája a kérdéstől függ.
A térfelhasználók és a szerzők áttekinthetik a kérdéseikre adott válaszokat. Az egyes válaszokat felfelé vagy lefelé mutató hüvelykujjal értékelhetik, vagy kérhetik a válasz felülvizsgálatát. A térszerkesztők és a szerzők az Előzmények lapon tekinthetik át ezt a visszajelzést a Genie térben.
Válaszok kiértékelése teljesítménymutatókkal
A teljesítménymutatók lehetővé teszik az egyes válaszok tesztelésének és kiértékelésének skálázását egy Genie-térben. Az utasításoktól eltérően a teljesítménytesztek a Genie-tér kiértékelésére, nem pedig tájékoztatására szolgálnak. Genie nem használ teljesítményteszt-kérdéseket vagy példa SQL-t a Genie környezetének javítására.
A teljesítménytesztek használatával tesztkérdések gyűjteményét futtathatja, és a válaszok segítségével mérheti Genie pontosságát. Opcionálisan megadhat egy SQL-utasítást, amely a várt eredményeket adja vissza. A teljesítményteszt-kérdés futtatásakor a Genie válaszát összehasonlítjuk az SQL-utasítás által megadott eredményekkel, és a pontosság szempontjából pontozza. A kérdés felülvizsgálatra van megjelölve, ha nem adott meg SQL-választ.
Lásd: Teljesítménytesztek használata Genie-térben.
Adatvédelem és biztonság
K: Milyen modellt használ Genie?
A Genie az Azure OpenAI-modellt használja.
K: Milyen adatokat küld a modellnek?
A Genie terek metaadatok és utasítások segítségével generálnak válaszokat a természetes nyelvi kérdésekre. Genie nem fér hozzá a sorszintű adatokhoz.
A válaszok feldolgozásához Genie a következőket használja:
- A felhasználó által küldött természetes nyelvi kérés
- Táblanevek és -leírások
- Oszlopcímek és leírások
- Általános utasítások
- Példa SQL-lekérdezésekre
- SQL-függvények
K: Az Azure OpenAI gyűjti az adataimat?
No. A Databricks engedélyezte a visszaélések monitorozása és az emberi felülvizsgálati program alóli mentességet, amely alatt a Microsoft nem tárol az Azure OpenAI szolgáltatásnak küldött kéréseket és kiegészítéseket. További információkért tekintse meg a Microsoft dokumentációját.