Adatok beolvasásának lehetőségei a Fabric Lakehouse-ba
Az adatbeolvasási felület az összes olyan felhasználói forgatókönyvet lefedi, amely adatokat hoz létre a lakehouse-ba, például:
- Csatlakozás meglévő SQL Serverhez, és adatok másolása a Lakehouse Delta táblájába.
- Fájlok feltöltése a számítógépről.
- Több tábla másolása és egyesítése más tóházakból egy új Delta-táblába.
- Csatlakozás streamelési forráshoz egy tóházban lévő adatok landolásához.
- Adatok hivatkozása más belső tóházakból vagy külső forrásokból történő másolás nélkül.
Az adatok tóházba való betöltésének különböző módjai
A Microsoft Fabricben többféleképpen is lekérhet adatokat egy tóházba:
- Fájlfeltöltés helyi számítógépről
- Másolási eszköz futtatása folyamatokban
- Adatfolyam beállítása
- Apache Spark-kódtárak jegyzetfüzetkódban
- Valós idejű események streamelése az Eventstreamdel
- Adatok lekérése az Eventhouse-ból
Helyi fájlfeltöltés
A helyi gépen tárolt adatokat is feltöltheti. Ezt közvetlenül a Lakehouse Explorerben teheti meg.
Másolási eszköz folyamatokban
A Másolás eszköz egy nagymértékben skálázható adatintegráció megoldás, amellyel különböző adatforrásokhoz csatlakozhat, és betöltheti az adatokat eredeti formátumban, vagy deltatáblává alakíthatja. A másolási eszköz olyan folyamattevékenységek része, amelyeket többféleképpen is módosíthat, például ütemezést vagy eseményalapú aktiválást. További információ: Adatok másolása másolási tevékenység használatával.
Adatfolyamok
A Power BI-adatfolyamokat ismerő felhasználók számára ugyanaz az eszköz áll rendelkezésre az adatok tóházba való betöltéséhez. A Lakehouse Explorer "Adatok lekérése" lehetőségével gyorsan elérheti, és több mint 200 összekötő adatait töltheti be. További információ : Rövid útmutató: Az első adatfolyam létrehozása az adatok lekéréséhez és átalakításához.
Jegyzetfüzet kódja
Az elérhető Spark-kódtárak segítségével közvetlenül csatlakozhat egy adatforráshoz, adatokat tölthet be egy adatkeretbe, majd mentheti őket egy tóházban. Ez a módszer a legnyitottabb módja az adatok betöltésének abban a lakehouse-ban, amelyet a felhasználói kód teljes mértékben kezel.
Feljegyzés
A Spark-kóddal létrehozott külső Delta-táblák nem lesznek láthatók az SQL Analytics-végpontok számára. A Táblatér parancsikonjaival láthatóvá teheti a külső Delta-táblákat egy SQL Analytics-végponton. A parancsikonok létrehozásáról a Fájlok vagy táblák parancsikonjának létrehozásacímű témakörben olvashat.
Valós idejű események streamelése az Eventstreamdel
Az Eventstream segítségével számos különböző forrásból szerezhet be, dolgozhat fel és irányíthat valós idejű eseményeket.
Ha meg szeretné tudni, hogyan adhat hozzá lakehouse-t az Eventstream célhelyéhez, olvassa el az Adatok lekérése az Eventstreamből egy tóházban című témakört.
Az optimális streamelési teljesítmény érdekében adatokat streamelhet az Eventstreamből egy Eventhouse-ba, majd engedélyezheti a OneLake rendelkezésre állását.
Adatok lekérése az Eventhouse-ból
Ha engedélyezi a OneLake rendelkezésre állását egy Eseményházban lévő adatokon, egy Delta-tábla jön létre a OneLake-ben. Ezt a Delta-táblát egy tóház érheti el egy parancsikon használatával. További információ: OneLake billentyűparancsok. További információ: Eventhouse OneLake Rendelkezésre állás.
Az adatok betöltésének megközelítésének kiválasztásakor megfontolandó szempontok
Használati eset | Ajánlás |
---|---|
Kis fájlfeltöltés helyi gépről | Helyi fájlfeltöltés használata |
Kis méretű adatok vagy adott összekötő | Adatfolyamok használata |
Nagy adatforrás | Másolási eszköz használata folyamatokban |
Összetett adatátalakítások | Jegyzetfüzet-kód használata |
Adatok streamelése | Az Eventstream használatával streamelhet adatokat az Eventhouse-ba; a OneLake rendelkezésre állásának engedélyezése és parancsikon létrehozása a Lakehouse-ból |
Idősoradatok | Adatok lekérése az Eventhouse-ból |
Kapcsolódó tartalom
- A lakehouse adatainak felfedezése jegyzetfüzettel
- Rövid útmutató: Az első folyamat létrehozása az adatok másolásához
- Adatok másolása másolási tevékenység használatával
- Adatok áthelyezése az Azure SQL DB-ből a Lakehouse-ba másolási asszisztensen keresztül
- Lakehouse-cél hozzáadása egy eseménystreamhez
- Eventhouse OneLake rendelkezésre állása