Microsoft Fabric terminológia
Ismerje meg a Microsoft Fabricben használt kifejezések definícióit, beleértve a Fabric Data Warehouse, a Fabric Data Engineering, a Fabric Data Science, a Real-Time Intelligence, a Data Factory és a Power BI kifejezéseket.
Általános feltételek
kapacitás: kapacitás egy dedikált erőforráskészlet, amely egy adott időpontban használható. A kapacitás határozza meg, hogy egy erőforrás képes-e tevékenység elvégzésére vagy kimenet létrehozására. A különböző elemek egy adott időpontban eltérő kapacitást használnak fel. A Fabric kapacitást kínál a Fabric termékváltozatán és próbaverzióján keresztül. További információ: Mi a kapacitás?
tapasztalat: Adott funkciókra vonatkozó képességek gyűjteménye. A Fabric-élmények közé tartozik a Fabric Data Warehouse, a Fabric Data Engineering, a Fabric Data Science, a Real-Time Intelligence, a Data Factory és a Power BI.
elem: Egy elem egy felhasználói felületen belüli képességek készlete. A felhasználók létrehozhatják, szerkeszthetik és törölhetik őket. Minden elemtípus különböző képességeket biztosít. Az Adatmérnöki felület például tartalmazza a lakehouse, a jegyzetfüzet és a Spark-feladatdefiníció elemeit.
bérlő: A bérlő a Microsoft Fabric egyetlen példánya egy szervezet számára, és össze van hangolva egy Microsoft Entra-azonosítóval.
munkaterület: A munkaterületek olyan elemek gyűjteményei, amelyek egyetlen, együttműködésre tervezett környezetben egyesítik a különböző funkciókat. Tárolóként működik, amely kapacitást használ a végrehajtott munkához, és vezérlőket biztosít, hogy ki férhet hozzá a benne lévő elemekhez. Például egy munkaterületen a felhasználók jelentéseket, jegyzetfüzeteket, szemantikai modelleket stb. hoznak létre. További információ: Munkaterületek cikk.
Fabric Data Engineering
Lakehouse: A lakehouse olyan fájlok, mappák és táblák gyűjteménye, amelyek egy adatbázist képviselnek egy data lake-en, amelyet az Apache Spark motor és az SQL-motor használnak nagy adatmennyiség feldolgozásához. A lakehouse továbbfejlesztett képességeket tartalmaz az ACID-tranzakciókhoz a nyílt forráskódú Delta formátumú táblák használatakor. A lakehouse-elem a Microsoft OneLake egy egyedi munkaterületi mappájában található. Különböző formátumú (strukturált és strukturálatlan) fájlokat tartalmaz mappákba és almappákba rendezve. További információ: Mi az a tóház?
Jegyzetfüzet: A Fabric-jegyzetfüzet egy többnyelvű interaktív programozási eszköz, gazdag függvényekkel. Ezek közé tartozik a kód és a markdown létrehozása, a Spark-feladatok futtatása és monitorozása, az eredmények megtekintése és vizualizációja, valamint a csapattal való együttműködés. Segít az adatmérnököknek és az adatelemzőknek az adatok feltárásában és feldolgozásában, valamint gépi tanulási kísérletek létrehozásában kóddal és alacsony kódszámú felhasználói felülettel. Könnyen átalakítható folyamatlánc tevékenységgé összehangolás céljából.
Spark-alkalmazás: Az Apache Spark-alkalmazás olyan program, amelyet egy felhasználó a Spark API-nyelveinek (Scala, Python, Spark SQL vagy Java) vagy Microsoft által hozzáadott nyelvek (.NET C# vagy F# használatával) használatával írt. Amikor egy alkalmazás fut, egy vagy több Spark-feladatra van osztva, amelyek párhuzamosan futnak az adatok gyorsabb feldolgozásához. A részletekért lásd a Spark alkalmazásfigyelésioldalt.
Apache Spark-feladat: A Spark-feladat egy Spark-alkalmazás része, amely párhuzamosan fut az alkalmazás többi feladatával. A feladatok több tevékenységből állnak. További információ: Spark-feladatok monitorozása.
Apache Spark-feladatdefiníció: a Spark-feladatdefiníció a felhasználó által beállított paraméterek készlete, amely jelzi a Spark-alkalmazások futtatásának módját. Lehetővé teszi a kötegelt vagy folyamatos feladatok küldését a Spark-fürtbe. További információ: Mi az Apache Spark-feladatdefiníció?
V-order: A parquet fájlformátumra történő írásoptimalizálás gyors olvasást tesz lehetővé, költséghatékonyságot és jobb teljesítményt nyújt. Alapértelmezés szerint minden Fabric-motor v-ordered parquet fájlokat ír.
Adatgyár
Összekötő: Data Factory számos olyan összekötőt kínál, amelyek lehetővé teszik a különböző típusú adattárakhoz való csatlakozást. A csatlakozás után átalakíthatja az adatokat. További információkért lásd a(z) összekötőket.
Adatfolyam: A Data Factoryben egy adatfolyamot használnak az adatáthelyezés és -átalakítás vezénylésére. Ezek a csővezetékek eltérnek a Fabric üzembe helyezési csővezetékeitől. További információért lásd a Data Factory áttekintésében található Pipelines részt.
Adatfolyam Gen2: Adatfolyamok alacsony kódú felületet biztosítanak több száz adatforrásból származó adatok betöltéséhez és az adatok átalakításához. A Fabric adatfolyamait adatfolyam Gen2-nek nevezzük. Az 1. generációs adatfolyam a Power BI-ban létezik. A Dataflow Gen2 további képességeket kínál az Azure Data Factoryben vagy a Power BI-ban futó adatfolyamokhoz képest. Nem frissíthet Gen1-ről Gen2-re. További információ: Adatfolyamok a Data Factory áttekintésében.
Trigger: A Data Factory olyan automatizálási képessége, amely meghatározott feltételek, például ütemezések vagy adatok rendelkezésre állása alapján indít folyamatokat.
Fabric Data Science
Data Wrangler: Data Wrangler egy jegyzetfüzet-alapú eszköz, amely magával ragadó élményt nyújt a felhasználóknak a feltáró adatok elemzéséhez. A funkció a rácsszerű adatmegjelenítést dinamikus összefoglaló statisztikákkal és gyakori adattisztítási műveletekkel kombinálja, és mindegyik elérhető néhány kiválasztott ikonnal. Minden művelet olyan kódot hoz létre, amelyet újrahasználható szkriptként menthet vissza a jegyzetfüzetbe.
Kísérlet: A gépi tanulási kísérlet az összes kapcsolódó gépi tanulási futtatás szervezetének és vezérlésének elsődleges egysége. További információ: Gépi tanulási kísérletek a Microsoft Fabric.
Modell: A gépi tanulási modell olyan fájl, amelyet bizonyos típusú minták felismerésére tanítottak be. Betanít egy modellt egy adatkészleten, és egy olyan algoritmust biztosít neki, amelyet az adott adatkészletben való érveléshez és tanuláshoz használ. További információ: Gépi tanulási modell.
Futtatás: A futtatás a modellkód egyetlen végrehajtásának felel meg. Az MLflow a nyomon követés kísérleteken és futtatásokon alapul.
Fabric adattárház
SQL Analytics-végpont: Minden Lakehouse rendelkezik egy SQL Analytics-végponttal, amely lehetővé teszi, hogy a felhasználó TSQL-en keresztül lekérdezze a deltatáblák adatait. További információ: SQL Analytics-végpont.
Fabric Data Warehouse: A Fabric Adattárház hagyományos adattárházként működik, és támogatja a vállalati adattárházaktól elvárható teljes tranzakciós T-SQL-képességeket. További információ: Fabric Data Warehouse.
Real-Time intelligencia
Activator: Activator egy kód nélküli, alacsony kódszámú eszköz, amellyel riasztásokat, eseményindítókat és műveleteket hozhat létre az adatokon. Az Activator használatával riasztásokat hozhat létre az adatfolyamokon. További információért lásd Aktivátor.
Eventhouse: Az Eventhouse-ok megoldást nyújtanak nagy mennyiségű adat kezelésére és elemzésére, különösen olyan helyzetekben, amelyek valós idejű elemzést és feltárást igényelnek. A valós idejű adatfolyamok hatékony kezelésére szolgálnak, így a szervezetek közel valós időben betölthetik, feldolgozhatják és elemezhetik az adatokat. Egyetlen munkaterület több Eseményházat is tartalmazhat, egy eseményház több KQL-adatbázist is tartalmazhat, és mindegyik adatbázis több táblát is tartalmazhat. Az Eventhouse áttekintésealatt talál részletes információt.
Eventstream: A Microsoft Fabric eventstreams szolgáltatás központi helyet biztosít a Fabric platformon a valós idejű események kódolás nélküli rögzítéséhez, átalakításához és átirányításához. Az eseménystreamek különböző streamelési adatforrásokból, betöltési célhelyekből és eseményfeldolgozóból állnak, amikor szükség van az átalakításra. További információért lásd a Microsoft Fabric eseményfolyamokat.
KQL-adatbázis: A KQL-adatbázis olyan formátumban tárolja az adatokat, amelyeken KQL-lekérdezéseket hajthat végre. A KQL-adatbázisok az Eventhouse elemei. További információ: KQL-adatbázis.
KQL-lekérdezéskészlet: A KQL-lekérdezéskészlet a lekérdezések futtatására, az eredmények megtekintésére és a lekérdezések eredményeinek módosítására szolgál az Adatkezelő adatbázisából származó adatokon. A lekérdezéskészlet tartalmazza az adatbázisokat és táblákat, a lekérdezéseket és az eredményeket. A KQL-lekérdezéskészlet lehetővé teszi a lekérdezések későbbi használatra való mentését, illetve a lekérdezések exportálását és megosztását másokkal. További információ: Lekérdezési adatok a KQL-lekérdezéskészletben
Real-Time csomópont
- Real-Time központ: Real-Time központ az összes mozgásban lévő adat egyetlen helye a teljes szervezetben. Minden Microsoft Fabric-bérlő automatikusan megkapja a központot. További információ: Real-Time hub áttekintése.
OneLake
- parancsikon: parancsikonok beágyazott hivatkozások a OneLake-ben, amelyek más fájltároló helyekre mutatnak. Lehetővé teszik a meglévő adatokhoz való csatlakozást anélkül, hogy közvetlenül át kellene másolniuk őket. További információért lásd a OneLake parancsikonokat.