Megosztás a következőn keresztül:


Mi az AI/BI Genie-terület?

Ez a cikk bemutatja az AI/BI Genie szolgáltatást, amely egy Azure Databricks-funkció, amellyel az üzleti csapatok természetes nyelven kezelhetik az adataikat. A szervezet terminológiájára és adataira szabott generatív AI-t használ, amely lehetővé teszi a teljesítmény monitorozását és finomítását a felhasználói visszajelzések segítségével.

Áttekintés

A tartományi szakértők, például az adatelemzők, adathalmazokkal, minta lekérdezésekkel és szöveges irányelvekkel konfigurálják a Genie-tereket, hogy segítsenek a Genie-nek üzleti kérdéseket elemzési lekérdezésekké alakítani. A beállítás után az üzleti felhasználók kérdéseket tehetnek fel, és vizualizációkat hozhatnak létre a működési adatok megértéséhez. Folyamatosan frissítheti Genie szemantikai tudását az adatok változásakor, és a felhasználók új kérdéseket tehetnek fel. További információ a DatabricksIQ-ról: DatabricksIQ-alapú funkciók.

Az AI/BI Genie a jegyzetekkel ellátott táblákból és oszlopokból kiválasztja a megfelelő neveket és leírásokat a természetes nyelvi kérdések egyenértékű SQL-lekérdezéssé alakításához. Ezután a létrehozott lekérdezéssel és eredménytáblával válaszol, ha lehetséges. Ha Genie nem tud választ adni, feltehet további kérdéseket, hogy tisztázza a választ, mielőtt választ ad.

Példák az alkalmazási helyzetekre

Különböző Genie-tereket hozhat létre a különböző nem technikai célközönségek kiszolgálásához. Az alábbi forgatókönyvek két lehetséges használati esetet írnak le.

1. példa: Lehetőség állapotának megjelenítése

Egy értékesítési vezető a nyitott és lezárt lehetőségek aktuális állapotát szeretné szakaszonként lekérni az értékesítési folyamatában. Természetes nyelv használatával kommunikálhatnak a Genie-térrel, és automatikusan vizualizációt hozhatnak létre.

Az alábbi gif a következő interakciót mutatja be:

Gif mintakérdéssel, válaszsal és automatikusan létrehozott vizualizációval

2. példa: A logisztika nyomon követése

Egy logisztikai vállalat Genie-terek használatával szeretné segíteni a különböző részlegek üzleti felhasználóit a működési és pénzügyi adatok nyomon követésében. Egy Genie-helyet állítottak fel a szállítási létesítmény vezetőinek a szállítmányok nyomon követésére, egy másik pedig a pénzügyi vezetők számára, hogy megértsék a pénzügyi állapotukat.

Hogyan generálja a Genie a választ?

Genie egy összetett AI-rendszert használ, az üzleti kérdések értelmezéséhez és válaszok létrehozásához. Egyetlen nagy nyelvi modell használata helyett összetett AI-rendszerek dolgozzák fel a feladatokat az AI-alkalmazásokban több interakciós összetevő kombinálásával. Az összetett AI-rendszerek a teljesítményük és rugalmasságuk miatt egyre gyakoribb tervezési mintát jelentenek az AI-alkalmazásokban. További információért lásd: A modellekről az összetett MI rendszerekre való áttérés.

Amikor egy felhasználó kérdést küld, Genie elemzi a kérést, azonosítja a releváns adatforrásokat, és meghatározza, hogyan válaszolhat a kérdésre. Az Ön által megadott utasítások a Unity Catalog metaadataival kombinálva lehetővé teszik a Genie számára, hogy üzleti és technikai logikát is kikövetkeztetjen. A Genie intelligensen szűri a példa SQL-lekérdezéseket, a tábla- és oszlop metaadatait és a csevegési előzményeket, hogy a kérés megválaszolásához a legrelevánsabb információkat választhassa ki.

A Genie a következő összetevőket használja a válaszok létrehozásához:

  • tábla metaadatainak: Táblázatneveket, leírásokat és meghatározott elsődleges kulcsot (PK) és idegenkulcs-kapcsolatokat (FK) tartalmaz. A Genie ezeket az adatokat használja a kérés elemzésekor, és a természetes nyelvi kérést SQL-vé alakítja.
  • Oszlopnevek és -leírások: A Genie intelligensen szűri a releváns oszlopneveket és leírásokat, hogy azokat beilleszthesse.
  • SQL példa-lekérdezések: A Genie intelligensen kiválasztja a releváns SQL-példákat az Utasításokból.
  • SQL-függvények: A térben hozzáadott összes SQL-függvény.
  • utasítások: A Általános utasítások szövegként megadott egyszerű szöveges jegyzetek kontextusként szerepelnek.
  • Parancssori és válaszelőzmények: Az aktuális csevegésből érkező kérések és válaszok kontextusként jelennek meg. Ha szükséges, a token korlátokbeállítása miatt a csevegési rekord legrégebbi részei kizárásra kerülnek.

Feljegyzés

Bizonyos táblázatadatok, például a tulajdonos és a tábla mérete alapértelmezés szerint nem szerepelnek a táblázatban. Az információk eléréséhez használja az összes Unity-katalógushoz elérhető információs sémából származó nézeteket. Az alapértelmezett nézetek szükségtelen részleteket is tartalmazhatnak, így egyéni nézet létrehozása segíthet a szükséges információkra összpontosítani. Az információs sémában elérhető információkról további információt az Információs sémacímű témakörben talál.

Ha a Genie eredményül ad vissza egy lekérdezést, az a kijelölt SQL Warehouse-on fut. Az újrapróbálkozások kezelése automatikusan megtörténik, az SQL Warehouse pedig az egyidejűséget és a skálázást kezeli.

Milyen adatokat használjak?

A Genie-tér a Unity Catalogban regisztrált adatokon alapul, beleértve a felügyelt táblákat, külső táblákat, idegen táblákat, nézeteket és materializált nézeteket. Az AI/BI Genie a Unity Catalog-objektumokhoz csatolt metaadatokat használja a válaszok létrehozásához. A jól jegyzett adathalmazok, amelyeket az Ön által megadott utasításoknak megfelelően adnak meg, kulcsfontosságúak ahhoz, hogy pozitív élményt teremtsen a végfelhasználók számára.

A Databricks a következőket javasolja:

  • Elemzési felhasználás adatainak lekontúrása: Rétegnézetek az oszlopok számának csökkentése érdekében, valamint használati esetspecifikus információk hozzáadása a válaszminőség növeléséhez.
  • Minimalizálja a Genie térben lévő táblák és oszlopok számát: Csak azokat a táblákat és oszlopokat vegye fel, amelyek szükségesek egy adott tartomány kérdéseinek megválaszolásához. A szükségtelen táblák vagy oszlopok miatt a Genie zavaró vagy helytelen válaszokat adhat, vagy hibaüzenetet jeleníthet meg.
  • Elsődleges kulcs (PK)/idegen kulcs (FK) kapcsolatok definiálása: A Unity Catalog segítségével definiálhat PK-/FK-kapcsolatokat, hogy a Genie megértse az adatok közti kapcsolatokat.

Fájlfeltöltések

Fontos

Ez a funkció nyilvános előzetes verzióban van.

A felhasználók saját kis adatfájlokat is feltölthetnek egy Genie-helyre. A fájlfeltöltés engedélyezéséhez forduljon a Databricks-fiók csapatához. További információ: Fájl feltöltése.

Megbízható eszközök

A megbízható eszközök további biztosítéki réteget nyújtanak az eredmény pontosságában egy helyfelhasználó számára. Ha egy paraméteres példa-lekérdezés vagy SQL-függvény pontos szövegét használja a válasz létrehozásához, a Genie a választ megbízható objektumként jelöli meg. Lásd: Megbízható objektumok használata AI-/BI Genie-szóközökben.

Csevegések

A legtöbb Genie-tér interakció egy csevegőablakban történik. A csevegési szálak az egyes felhasználók interakcióinak rekordját menti. Minden csevegési szál fenntartja a korábbi kérdések kontextusát. Genie a beszélgetési előzmények kontextusával tanulja meg, hogy a felhasználók követési kérdéseket tegyenek fel az eredményhalmaz további feltárásához vagy újrafókuszásához.

Azok a felhasználók, akik legalább megtekintési hozzáféréssel rendelkeznek egy térhez, megtekinthetik a saját csevegési előzményeiket. A legalább SZERKESZTHETŐ jogosultsággal rendelkező felhasználók áttekinthetik a szekció Előzmények lapján az összes kérdést és választ.

Válaszok áttekintése

A legtöbb válasz tartalmaz egy természetes nyelvű magyarázatot és egy táblázatot, amely a releváns eredményhalmazt mutatja. A forrástáblák a magyarázat alatt jelennek meg, és az eredmények létrehozásához használt SQL-lekérdezés a válasz részletei között érhető el. Ha egy vizualizáció javítaná a tisztánlátást, a Genie tartalmaz egyet. Az egyes válaszok struktúrája a kérdéstől függ.

A térfelhasználók és a szerzők áttekinthetik a kérdéseikre adott válaszokat. Az egyes válaszokat felfelé vagy lefelé mutató hüvelykujjal értékelhetik, vagy kérhetik a válasz felülvizsgálatát. A térszerkesztők és a szerzők az Előzmény ikonElőzmények lapon tekinthetik át ezt a visszajelzést a Genie térben.

Válaszok kiértékelése teljesítménymutatókkal

A teljesítménymutatók lehetővé teszik az egyes válaszok tesztelésének és kiértékelésének skálázását egy Genie-térben. Az utasításoktól eltérően a teljesítménytesztek a Genie-tér kiértékelésére, nem pedig tájékoztatására szolgálnak. Genie nem használ teljesítményteszt-kérdéseket vagy példa SQL-t a Genie környezetének javítására.

A teljesítménytesztek használatával tesztkérdések gyűjteményét futtathatja, és a válaszok segítségével mérheti Genie pontosságát. Opcionálisan megadhat egy SQL-utasítást, amely a várt eredményeket adja vissza. A teljesítményteszt-kérdés futtatásakor a Genie válaszát összehasonlítjuk az SQL-utasítás által megadott eredményekkel, és a pontosság szempontjából pontozza. A kérdés felülvizsgálatra van megjelölve, ha nem adott meg SQL-választ.

Lásd: Teljesítménytesztek használata Genie-térben.

Adatvédelem és biztonság

K: Milyen modellt használ Genie?

A Genie az Azure OpenAI-modellt használja.

K: Milyen adatokat küld a modellnek?

A Genie terek metaadatok és utasítások segítségével generálnak válaszokat a természetes nyelvi kérdésekre. Genie nem fér hozzá a sorszintű adatokhoz.

A válaszok feldolgozásához Genie a következőket használja:

  • A felhasználó által küldött természetes nyelvi kérés
  • Táblanevek és -leírások
  • Oszlopcímek és leírások
  • Általános utasítások
  • Példa SQL-lekérdezésekre
  • SQL-függvények

K: Az Azure OpenAI gyűjti az adataimat?

No. A Databricks engedélyezte a visszaélések monitorozása és az emberi felülvizsgálati program alóli mentességet, amely alatt a Microsoft nem tárol az Azure OpenAI szolgáltatásnak küldött kéréseket és kiegészítéseket. További információkért tekintse meg a Microsoft dokumentációját.