Zdieľať cez


Prehľad Copilot pre dátovú vedu a dátové inžinierstvo (Preview)

Dôležitý

Táto funkcia je ukážky.

Copilot for Data Science a Data Engineering je asistent umelej inteligencie, ktorý pomáha analyzovať a vizualizovať údaje. Funguje s tabuľkami a súbormi lakehouse, množinami údajov služby Power BI a údajovými prvkami pandas/spark/fabric, poskytuje odpovede a úryvky kódu priamo v poznámkovom bloku. Najúčinnejší spôsob používania Copilot je pridanie údajov ako údajového rámca. Svoje otázky môžete položiť na paneli chatu a umelá inteligencia poskytne odpovede alebo kód na skopírovanie do poznámkového bloku. Rozumie schéme a metaúdajom vašich údajov a ak sa údaje načítajú do údajového rámca, spoznáva aj údaje v údajovom ráme. Môžete požiadať Copilot, aby poskytla prehľady o údajoch, vytvorila kód pre vizualizácie alebo poskytla kód na transformácie údajov, a rozpoznáva názvy súborov, čím sa zjednoduší. Copilot zjednodušuje analýzu údajov tým, že eliminuje komplexné kódovanie.

Nota

Úvod do Copilot v oblasti dátovej vedy a dátového inžinierstva v dátovej vede

So Copilot pre dátovú vedu a dátové inžinierstvo môžete chatovať s asistentom umelej inteligencie, ktorý vám pomôže zvládnuť vaše úlohy analýzy údajov a vizualizácie. V poznámkových blokoch môžete klásť Copilot otázky týkajúce sa tabuliek lakehouse, množín údajov služby Power BI alebo údajových rámcov Pandas/Spark. Copilot odpovede v prirodzenom jazyku alebo úryvky kódu. Copilot môžete v závislosti od úlohy tiež vygenerovať kód špecifický pre údaje. Napríklad Copilot pre dátovú vedu a dátové inžinierstvo môže generovať kód pre:

  • Vytvorenie grafu
  • Filtrovanie údajov
  • Použitie transformácií
  • Modely strojového učenia

Najprv vyberte ikonu Copilot na páse s nástrojmi poznámkových blokov. Otvorí sa panel Copilot chatu a v hornej časti poznámkového bloku sa zobrazí nová bunka. Táto bunka sa musí spustiť pri každom načítaní relácie služby Spark v poznámkovom bloku služby Fabric. V opačnom prípade nebude Copilot prostredie správne fungovať. Momentálne vyhodnocovame ďalšie mechanizmy na spracovanie tejto potrebnej inicializácie v budúcich vydaniach.

Snímka obrazovky zobrazujúca tlačidlo Copilot na páse s nástrojmi.

Spustite bunku v hornej časti poznámkového bloku pomocou tohto kódu:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Po úspešnom vykonaní bunky môžete použiť Copilot. Vždy, keď sa relácia v notebooku zavrie, musíte ju znova spustiť do hornej časti poznámkového bloku.

Snímka obrazovky zobrazujúca úspešné vykonanie bunky.

Ak chcete maximalizovať Copilot efektivitu, načítajte tabuľku alebo množinu údajov ako údajový rámec v poznámkovom bloku. Týmto spôsobom môže AI pristupovať k údajom a pochopiť jeho štruktúru a obsah. Potom začnite chatovať s umelou inteligenciou. Vyberte ikonu chatu na paneli s nástrojmi poznámkového bloku a zadajte svoju otázku alebo požiadavku do panela chatu. Môžete sa napríklad opýtať:

  • Aký je priemerný vek zákazníkov v tejto množine údajov?"
  • "Show me a bar chart of sales by region" (Zobraziť pruhový graf predaja podľa oblasti)

A ešte oveľa viac. Copilot reaguje odpoveďou alebo kódom, ktorý môžete skopírovať a prilepiť do poznámkového bloku. Copilot for Data Science a Data Engineering predstavuje pohodlný, interaktívny spôsob skúmania a analýzy údajov.

Pri používaní Copilotmôžete vyvolať aj magické príkazy vo vnútri notebookovej bunky, aby ste získali výstup priamo v notebooku. V prípade odpovedí v prirodzenom jazyku môžete napríklad klásť otázky pomocou príkazu "%%chat", ako napríklad:

%%chat
What are some machine learning models that may fit this dataset?

Snímka obrazovky zobrazujúca generovanie kódu.

alebo

%%code
Can you generate code for a logistic regression that fits this data?

Snímka obrazovky zobrazujúca generovanie logistického regresie kódu.

Copilot pre dátovú vedu a dátové inžinierstvo má tiež schému a metaúdaje povedomia o tabuľkách v úložisku lakehouse. Copilot môže poskytnúť relevantné informácie v kontexte vašich údajov v priloženom jazere. Môžete sa napríklad opýtať:

  • "Koľko tabuliek je v úzovni Lakehouse?"
  • "Aké sú stĺpce zákazníkov tabuľky?"

Copilot odpovie s relevantnými informáciami, ak ste pridali lakehouse do notebooku. Copilot má tiež povedomie o názvoch súborov pridaných do akéhokoľvek lakehouse pripojené k notebooku. V chate môžete na tieto súbory odkazovať podľa názvu. Ak máte napríklad súbor s názvom sales.csv vo svojom jazere, môžete sa spýtať "Vytvoriť údajový rámec z sales.csv". Copilot vygeneruje kód a zobrazí ho na paneli chatu. S Copilot pre poznámkové bloky môžete jednoducho pristupovať a dotazovať svoje údaje z rôznych zdrojov. Nepotrebujete na to presnú syntax príkazov.

Tipy

  • "Clear" (Vymazať) konverzáciu na Copilot paneli chatu s metlou v hornej časti panela chatu. Copilot si zachová vedomosti o vstupoch alebo výstupoch počas relácie, ale to vám pomôže, ak nájdete aktuálny obsah rušivý.
  • Pomocou knižnice čarodejníc chatu môžete nakonfigurovať nastavenia týkajúce sa Copilotvrátane nastavení ochrany osobných údajov. Predvolený režim zdieľania je navrhnutý tak, aby maximalizoval kontextové zdieľanie Copilot má prístup, takže obmedzenie poskytnutých informácií na skopírovanie môže priamo a výrazne ovplyvniť relevantnosť jeho odpovedí.
  • Keď Copilot prvý raz spustí, ponúkne množinu užitočných výziev, ktoré vám môžu pomôcť začať. Môžu pomôcť naštartovať vašu konverzáciu s Copilot. Ak si chcete pozrieť výzvy neskôr, môžete použiť tlačidlo iskru v dolnej časti panela chatu.
  • Bočný panel kopilotu môžete "presunúť" a rozbaliť panel chatu, čím sa zobrazí kód prehľadnejší alebo čitateľnejší pre výstupy na obrazovke.

Obmedzenia

Copilot funkcie v prostredí dátovej vedy sú v súčasnosti obmedzené na poznámkové bloky. Medzi tieto funkcie patrí Copilot tabla chatu, magické príkazy IPython, ktoré možno použiť v rámci bunky kódu, a návrhy automatického kódu počas písania v bunke kódu. Copilot tiež môžu čítať sémantické modely služby Power BI pomocou integrácie sémantického prepojenia.

Copilot má dva kľúčové zamýšľané použitia:

  • Po jednom môžete požiadať Copilot preskúmať a analyzovať údaje v poznámkovom počítači (napríklad najprv načítaním prvku DataFrame a potom sa spýtať Copilot na údaje v rámci prvku DataFrame).
  • Po druhej môžete požiadať Copilot vygenerovať širokú škálu návrhov o vašom procese analýzy údajov, ako napríklad informácie o tom, aké prediktívne modely môžu byť relevantné, kód na vykonávanie rôznych typov analýzy údajov a dokumentácia pre dokončený poznámkový blok.

Majte na pamäti, že generovanie kódu s rýchlo sa pohybujúcimi alebo nedávno vydanými knižnicami môže obsahovať nepresnosť alebo štruktúry.