Tableau en Azure Databricks verbinden
In dit artikel leest u hoe u Partner Connect gebruikt om vanuit Azure Databricks verbinding te maken met Tableau Desktop en van Tableau Desktop of Tableau Cloud met Azure Databricks. Dit artikel bevat ook informatie over Tableau Server op Linux.
Wanneer u Azure Databricks gebruikt als gegevensbron met Tableau, kunt u krachtige interactieve analyses bieden, zodat u de bijdragen van uw gegevenswetenschappers en gegevenstechnici aan uw bedrijfsanalisten kunt leveren door te schalen naar enorme gegevenssets.
verkennen in Tableau Cloud vanuit Azure Databricks
Wanneer u Azure Databricks gebruikt als gegevensbron met Tableau Cloud, kunt u Tableau-gegevensbronnen rechtstreeks vanuit tabellen of schema's maken vanuit de databricks-gebruikersinterface.
Vereisten
- Uw gegevens moeten zich in de Unity-catalogus bevinden en uw rekenproces (cluster) moet Unity Catalog zijn ingeschakeld. Hive-metastore wordt momenteel niet ondersteund.
Azure Databricks-tabellen publiceren naar een Tableau Cloud
- Meld u aan bij uw Databricks-werkruimte en klik op
Catalogus in de zijbalk om Catalog Explorer te openen.
- Selecteer een rekenresource in de vervolgkeuzelijst rechtsboven.
- Open een catalogus en selecteer het schema of de tabellen die u wilt publiceren. Selecteer geen hive-metastore of de voorbeeldcatalogus.
- Klik rechtsboven op Gebruiken met BI-hulpprogramma's voor een schema of Openen in een dashboard voor een tabel.
- Selecteer Verkennen in Tableau Cloud.
- Controleer dat de gegevens van Compute en Publish gewenst zijn, en klik vervolgens op Verkennen in Tableau Cloud.
- Na 10 tot 20 seconden verschijnt er een nieuw tabblad waarin u wordt gevraagd om u aan te melden bij uw Tableau Cloud-account.
- Nadat u zich hebt aangemeld, komt u terecht op de Tableau-pagina, waarin u wordt gevraagd u weer aan te melden bij Azure Databricks.
- Nadat u zich hebt aangemeld bij Azure Databricks, kunt u beginnen met het bouwen van een dashboard op de pagina werkmapeditor.
- U kunt ook klikken op de knop Openen in Tableau Cloud om de werkmap in Tableau Cloud te openen.
Functies en notities
- U kunt een tabel of een schema publiceren. Wanneer u een schema publiceert, moet u een tabel selecteren in het deelvenster Tableau Gegevensbron.
- Databricks dwingt OAuth- af als verificatiemodus bij het publiceren naar Tableau Cloud.
- De gepubliceerde gegevensbron bevindt zich in de conceptmodus en is niet overal opgeslagen. U moet deze opslaan vanuit Tableau Cloud om deze toegankelijk te maken voor anderen.
- De omleidingskoppeling die door Tableau wordt geretourneerd, verloopt na ongeveer 5 minuten.
Vereisten voor het verbinden van Tableau en Azure Databricks
De verbindingsgegevens voor een rekenresource of SQL Warehouse, met name de Server-hostnaam en HTTP-pad waarden.
Tableau Desktop 2019.3 of hoger.
Databricks ODBC-stuurprogramma 2.6.15 of hoger.
Een Microsoft Entra ID-token (voorheen Azure Active Directory) (aanbevolen), een Azure Databricks persoonlijk toegangstokenof uw Microsoft Entra ID-accountreferenties.
Notitie
Als best practice voor beveiliging, wanneer u zich verifieert met geautomatiseerde hulpprogramma's, systemen, scripts en apps, raadt Databricks u aan om persoonlijke toegangstokens te gebruiken die behoren tot service-principals in plaats van werkruimtegebruikers. Zie Tokens voor een service-principal beheren om tokens voor service-principals te maken.
Aan u moet een van de volgende Microsoft Entra ID-rollen zijn toegewezen:
Als de werkstroom voor beheerderstoestemming is geconfigureerd, kunnen niet-beheerders bij het aanmelden toegang tot Tableau aanvragen.
Azure Databricks verbinden met Tableau Desktop met behulp van Partner Connect
U kunt Partner Connect gebruiken om in slechts een paar klikken een rekenresource of SQL Warehouse te verbinden met Tableau Desktop.
- Zorg ervoor dat uw Azure Databricks-account, werkruimte en de aangemelde gebruiker allemaal voldoen aan de vereisten voor Partner Connect.
- Klik in de zijbalk op
Marketplace-.
- Klik in Partner Connect-integratiesop Alles weergeven.
- Klik op de tegel Tableau .
- Kies in het dialoogvenster Verbinding maken met partner voor Compute de naam van de Azure Databricks-rekenresource die u wilt verbinden.
- Kies Verbindingsbestand downloaden.
- Open het gedownloade verbindingsbestand, waarmee Tableau Desktop wordt gestart.
- Voer in Tableau Desktop uw verificatiereferenties in en klik vervolgens op Aanmelden:
- Als u een Microsoft Entra ID-token wilt gebruiken, voert u het token in voor gebruikersnaam en uw Microsoft Entra ID-token voor wachtwoord.
- Als u een persoonlijk toegangstoken van Azure Databricks wilt gebruiken, voert u het token in voor gebruikersnaam en uw persoonlijke toegangstoken voor wachtwoord.
- Als u uw Microsoft Entra ID-referenties wilt gebruiken, klikt u op Verbinding bewerken, dubbelklikt u op de database op het tabblad Gegevens en selecteert u vervolgens Microsoft Entra-id in de lijst Authentication.
Voor Tableau Desktop 2021.1 en hoger:
- Als u geen Microsoft Entra ID (voorheen Azure Active Directory) B2B-gastaccount of Azure Databricks in Azure Government gebruikt, kunt u gewoon invoeren
https://login.microsoftonline.com/common
als het OAuth-eindpunt.
- Als u inderdaad een Microsoft Entra ID B2B-gastaccount of Azure Databricks op Azure Government gebruikt, neem dan contact op met uw beheerder om een speciale service-principal voor Microsoft Entra ID te verkrijgen.
Notitie
Als u geen beheerder bent, wordt de fout Goedkeuring door beheerder nodig weergegeven. Vraag een cloudtoepassingsbeheerder of toepassingsbeheerder om u toestemming te geven om verbinding te maken met Tableau en probeer u vervolgens opnieuw aan te melden.
Als voor uw Microsoft Entra ID-account de werkstroom voor beheerderstoestemming is ingeschakeld, vraagt Tableau Desktop u om toegang tot Tableau aan te vragen. Nadat een cloudtoepassingsbeheerder of toepassingsbeheerder de aanvraag goedkeurt, probeert u zich opnieuw aan te melden.
- Als u geen Microsoft Entra ID (voorheen Azure Active Directory) B2B-gastaccount of Azure Databricks in Azure Government gebruikt, kunt u gewoon invoeren
Tableau Desktop verbinden met Azure Databricks
Volg deze instructies om vanuit Tableau Desktop verbinding te maken met een rekenresource of SQL Warehouse.
Notitie
Gebruik Partner Connect om sneller verbinding te maken met Tableau Desktop.
Start Tableau Desktop.
Klik op Bestand > nieuw.
Klik op het tabblad Gegevens op Verbinding maken met gegevens.
Klik in de lijst met connectors op Databricks-.
Voer de hostnaam van de server en het HTTP-pad in.
Voor verificatiekiest u uw verificatiemethode, voert u uw verificatiereferenties in en klikt u vervolgens op Aanmelden.
Als u een Microsoft Entra ID-token wilt gebruiken, selecteert u persoonlijk toegangstoken en voert u uw Microsoft Entra ID-token in voor Wachtwoord.
Als u een persoonlijk toegangstoken van Azure Databricks wilt gebruiken, selecteert u persoonlijk toegangstoken en voert u uw persoonlijke toegangstoken in voor Wachtwoord.
Als u uw Microsoft Entra ID-referenties wilt gebruiken, selecteert u Microsoft Entra ID.
Voor Tableau Desktop 2021.1 en hoger:
Als u geen Microsoft Entra ID (voorheen Azure Active Directory) B2B-gastaccount of Azure Databricks in Azure Government gebruikt, kunt u gewoon invoeren
https://login.microsoftonline.com/common
als het OAuth-eindpunt.- Als u wel een Microsoft Entra ID B2B-gastaccount of Azure Databricks in Azure Government gebruikt, neemt u contact op met uw beheerder om een toegewezen Microsoft Entra ID-magazijn te verkrijgen.
Notitie
Als u geen beheerder bent, wordt de fout Goedkeuring door beheerder nodig weergegeven. Vraag een cloudtoepassingsbeheerder of toepassingsbeheerder om u machtigingen te geven om verbinding te maken met Tableau en probeer u vervolgens opnieuw aan te melden.
Als voor uw Microsoft Entra ID-account de werkstroom voor beheerderstoestemming is ingeschakeld, vraagt Tableau Desktop u om toegang tot Tableau aan te vragen. Nadat een cloudtoepassingsbeheerder of toepassingsbeheerder de aanvraag goedkeurt, probeert u zich opnieuw aan te melden.
Als Unity Catalog is ingeschakeld voor uw werkruimte, stelt u ook de standaardcatalogus in. Voeg op het tabblad Geavanceerd voor verbindingseigenschappen Als u de standaardcatalogus wilt wijzigen, voert u in op het tabblad
USE CATALOG <catalog-name>
.
Tableau Cloud verbinden met Azure Databricks
Volg deze instructies om vanuit Tableau Cloud verbinding te maken met een rekenresource of SQL-warehouse.
- Een nieuwe werkmap starten
- Klik op de menubalk op Gegevens>nieuwe gegevensbron.
- Klik op de pagina Verbinding maken met gegevens op Connectors>Databricks.
- Voer op de pagina Azure Databricks de serverhostnaam en http-pad waarden in.
- Selecteer uw verificatiemethode en voer de gevraagde gegevens in (indien van toepassing).
- Klik op Aanmelden.
Tableau Server in Linux
Bewerken /etc/odbcinst.ini
om het volgende op te nemen:
[Simba Spark ODBC Driver 64-bit]
Description=Simba Spark ODBC Driver (64-bit)
Driver=/opt/simba/spark/lib/64/libsparkodbc_sb64.so
Notitie
Tableau Server op Linux raadt de 64-bits verwerkingsarchitectuur aan.
Een werkmap publiceren en vernieuwen in Tableau Cloud vanuit Tableau Desktop
In dit artikel wordt beschreven hoe u een werkmap publiceert van Tableau Desktop naar Tableau Cloud en deze bijwerkt wanneer de gegevensbron wordt gewijzigd. U hebt een werkmap nodig in Tableau Desktop en een Tableau Cloud-account .
- Pak de gegevens van de werkmap uit Tableau Desktop uit: klik in Tableau Desktop, met de werkmap die u wilt publiceren, op Gegevens extraheren.>
<data-source-name>
> - Klik in het dialoogvenster Gegevens extraheren op Uitpakken.
- Blader naar een locatie op uw lokale computer waar u de geëxtraheerde gegevens wilt opslaan en klik vervolgens op Opslaan.
- Publiceer de gegevensbron van de werkmap naar Tableau Cloud: klik in Tableau Desktop op Server Publish Data Source>>.
<data-source-name>
- Als het dialoogvenster Aanmelden bij Tableau Server wordt weergegeven, klikt u op de koppeling Tableau Cloud en volgt u de aanwijzingen op het scherm om u aan te melden bij Tableau Cloud.
- Klik in het dialoogvenster Gegevensbron publiceren naar Tableau Cloud naast Vernieuwen niet ingeschakeldop de koppeling Bewerken.
- Wijzig in het vervolgmenu dat wordt weergegeven, voor Authenticatie, Vernieuwen niet is ingeschakeld in Toegang tot vernieuwen toestaan.
- Klik ergens buiten deze flyout om deze te verbergen.
- Klik op om de werkmap bij te werken en de gepubliceerde gegevensbronte gebruiken.
- Klik op Publiceren. De gegevensbron wordt weergegeven in Tableau Cloud.
- Klik in Tableau Cloud in het dialoogvenster Publiceren voltooid op Planning en volg de aanwijzingen op het scherm.
- Publiceer de werkmap naar Tableau Cloud: klik in Tableau Desktop, met de werkmap die u wilt publiceren, op Server > Publish Workbook.
- Klik in het dialoogvenster Werkmap publiceren naar Tableau Cloud op Publiceren. De werkmap wordt weergegeven in Tableau Cloud.
Tableau Cloud controleert op wijzigingen in de gegevensbron volgens de planning die u hebt ingesteld en werkt de gepubliceerde werkmap bij als er wijzigingen worden gedetecteerd.
Zie het volgende op de Tableau-website voor meer informatie:
- Een gegevensbron publiceren
- Uitgebreide stappen voor het publiceren van een werkmap
- Vernieuwingen plannen bij het publiceren van een werkmap
Aanbevolen procedures en problemen oplossen
De twee fundamentele acties voor het optimaliseren van Tableau-query's zijn:
- Verminder het aantal records dat wordt opgevraagd en gevisualiseerd in één grafiek of dashboard.
- Verminder het aantal query's dat door Tableau in één grafiek of dashboard wordt verzonden.
Bepalen welke eerste poging moet worden uitgevoerd, is afhankelijk van uw dashboard. Als u een aantal verschillende grafieken voor afzonderlijke gebruikers in hetzelfde dashboard hebt, is het waarschijnlijk dat Tableau te veel query's naar Azure Databricks verzendt. Als u slechts een aantal grafieken hebt, maar het lang duurt om ze te laden, worden er waarschijnlijk te veel records geretourneerd door Azure Databricks om effectief te laden.
Tableau-prestatieopname, beschikbaar op zowel Tableau Desktop als Tableau Server, kan u helpen prestatieknelpunten te identificeren door processen te identificeren die latentie veroorzaken wanneer u een bepaalde werkstroom of dashboard uitvoert.
Prestatie-opname inschakelen om fouten op te sporen in Tableau
Als de uitvoering van query's bijvoorbeeld het probleem is, weet u dat dit te maken heeft met het proces van de gegevensengine of de gegevensbron waarop u een query uitvoert. Als de visuele indeling langzaam presteert, weet u dat het de VizQL is.
Als de prestatieopname aangeeft dat de latentie zich in de uitvoerquery bevindt, is het waarschijnlijk dat Azure Databricks te veel tijd neemt om de resultaten te retourneren of dat de ODBC/Connector-overlay te veel tijd nodig heeft om de gegevens om te zetten in SQL voor VizQL. Wanneer dit gebeurt, moet u analyseren wat u retourneert en proberen om het analytische patroon te wijzigen in een dashboard per groep, segment of artikel in plaats van alles in één dashboard teramen en te vertrouwen op snelle filters.
Als de slechte prestaties worden veroorzaakt door sorteren of visuele indeling, kan het probleem het aantal markeringen zijn dat het dashboard probeert te retourneren. Azure Databricks kan snel één miljoen records retourneren, maar Tableau kan de indeling mogelijk niet berekenen en de resultaten sorteren. Als dit een probleem is, voegt u de query samen en zoomt u in op de lagere niveaus. U kunt ook een grotere machine proberen, omdat Tableau alleen wordt beperkt door fysieke resources op de computer waarop deze wordt uitgevoerd.
Zie Een prestatie-opname maken voor een uitgebreide zelfstudie over de prestatierecorder.
Prestaties op Tableau Server versus Tableau Desktop
Over het algemeen is een werkstroom die wordt uitgevoerd op Tableau Desktop niet sneller op Tableau Server. Een dashboard dat niet wordt uitgevoerd op Tableau Desktop, wordt niet uitgevoerd op Tableau Server.
Het gebruik van Desktop is een veel betere techniek voor probleemoplossing, omdat Tableau Server meer processen heeft om rekening mee te houden wanneer u problemen oplost. Als dingen werken in Tableau Desktop, maar niet in Tableau Server, kunt u het probleem veilig beperken tot de processen in Tableau Server die zich niet in Tableau Desktop bevinden.
Configuratie
Standaard overschrijven de parameters van de verbindings-URL deze in de Simba ODBC DSN. U kunt de ODBC-configuraties op twee manieren aanpassen vanuit Tableau:
.tds
bestand voor één gegevensbron:- Volg de instructies in Gegevensbronnen opslaan om het
.tds
bestand voor de gegevensbron te exporteren. - Zoek de eigenschapsregel
odbc-connect-string-extras=''
in het.tds
bestand en stel de parameters in. Als u bijvoorbeeld de regel wilt inschakelenAutoReconnect
enUseNativeQuery
, kunt u de regel wijzigen inodbc-connect-string-extras='AutoReconnect=1,UseNativeQuery=1'
. - Laad het
.tds
bestand opnieuw door opnieuw verbinding te maken met de verbinding.
De rekenresource is geoptimaliseerd voor het gebruik van minder heapgeheugen voor het verzamelen van grote resultaten, zodat er meer rijen per ophaalblok kunnen worden gebruikt dan de standaardinstelling van Simba ODBC. Voeg toe
RowsFetchedPerBlock=100000'
aan de waarde van deodbc-connect-string-extras
eigenschap.- Volg de instructies in Gegevensbronnen opslaan om het
.tdc
bestand voor alle gegevensbronnen:- Als u nog nooit een
.tdc
bestand hebt gemaakt, kunt u TableauTdcExample.tdc toevoegen aan de mapDocument/My Tableau Repository/Datasources
. - Voeg het bestand toe aan alle Tableau Desktop-installaties van ontwikkelaars, zodat het werkt wanneer de dashboards worden gedeeld.
- Als u nog nooit een
Grafieken optimaliseren (werkbladen)
Er zijn een aantal tactische grafiekoptimalisaties waarmee u de prestaties van uw Tableau-werkbladen kunt verbeteren.
Gebruik contextfilters om de uitvoeringstijd te versnellen voor filters die niet vaak veranderen en die niet bedoeld zijn om te worden gebruikt.
Een andere goede vuistregel is het gebruik if/else
van instructies in plaats van case/when
instructies in uw query's.
Tableau kan filters naar gegevensbronnen pushen, waardoor querysnelheden kunnen worden verbeterd. Raadpleeg Filteren met behulp van een parameter over meerdere gegevensbronnen en Gegevens filteren over meerdere gegevensbronnenvoor meer informatie over filters die naar beneden in de gegevensbron worden gepusht.
Probeer tabelberekeningen te voorkomen terwijl ze de volledige gegevensset scannen. Zie Waarden transformeren met tabelberekeningenvoor meer informatie over tabelberekeningen.
Dashboards optimaliseren
Hier volgen enkele tips en oefeningen voor probleemoplossing die u kunt toepassen om de prestaties van uw Tableau-dashboard te verbeteren.
Wanneer Tableau-dashboards zijn verbonden met Azure Databricks, kunnen snelle filters op afzonderlijke dashboards die een aantal verschillende gebruikers, functies of segmenten bedienen, een veelvoorkomende bron van problemen zijn. U kunt snelle filters toevoegen aan alle grafieken op het dashboard. Eén snel filter op een dashboard met vijf grafieken zorgt ervoor dat minimaal 10 query's worden verzonden naar Azure Databricks. Dit kan toenemen tot grotere aantallen wanneer er meer filters worden toegevoegd en kan prestatieproblemen veroorzaken omdat Spark niet is gebouwd om veel gelijktijdige query's op hetzelfde moment af te handelen. Dit wordt problematischer wanneer het Azure Databricks-cluster of SQL Warehouse dat u gebruikt, niet groot genoeg is om het grote aantal query's af te handelen.
Als eerste stap raden we u aan tableau-prestatieopnamen te gebruiken om op te lossen wat het probleem kan veroorzaken.
Als de slechte prestaties worden veroorzaakt door sorteren of visuele indeling, kan het probleem het aantal markeringen zijn dat het dashboard probeert terug te geven. Azure Databricks kan snel één miljoen records retourneren, maar Tableau kan de indeling mogelijk niet berekenen en de resultaten sorteren. Als dit een probleem is, voegt u de query samen en zoomt u in op de lagere niveaus. U kunt ook een grotere machine proberen, omdat Tableau alleen wordt beperkt door de fysieke resources op de computer waarop deze wordt uitgevoerd.
Zie Inzoomen op de details voor meer informatie over inzoomen in Tableau.
Als u veel gedetailleerde markeringen ziet, is dit vaak een slecht analytisch patroon omdat het geen inzicht biedt. Inzoomen op hogere aggregatieniveaus is logischer en vermindert het aantal records dat moet worden verwerkt en gevisualiseerd.
Acties gebruiken om dashboards te optimaliseren
Gebruik Tableau _actions om een markering aan te klikken (bijvoorbeeld een staat op een kaart) en wordt u naar een ander dashboard gestuurd dat op basis van de door u aangeklikte staat filtert. Het gebruik van _actions vermindert de noodzaak van meerdere filters op één dashboard en het aantal records dat moet worden gegenereerd. (U stelt een actie in op , niet op, om records te genereren totdat er een predicaat beschikbaar is om op te filteren.
Zie acties en 6 tips om uw dashboards beter presterend te maken voor meer informatie.
Caching
Het opslaan van gegevens in de cache is een goede manier om de prestaties van werkbladen of dashboards te verbeteren.
Caching in Tableau
Tableau heeft vier cachelagen voordat deze teruggaat naar de gegevens, ongeacht of die gegevens zich in een liveverbinding of een extract bevinden:
- tegels: Als iemand hetzelfde dashboard laadt en er niets verandert, probeert Tableau dezelfde tegels opnieuw te gebruiken voor de grafieken. Dit is vergelijkbaar met Google Maps-tegels.
- model: als de tegelscache niet kan worden gebruikt, wordt de modelcache van wiskundige berekeningen gebruikt om visualisaties te genereren. Tableau Server probeert dezelfde modellen te gebruiken.
- Abstract: geaggregeerde resultaten van query's worden ook opgeslagen. Dit is het derde 'verdedigingsniveau'. Als een query Sum(Sales), Count(orders), Sum(Cost), in een vorige query en een toekomstige query alleen Sum(Sales) retourneert, haalt Tableau dat resultaat op en gebruikt het.
- systeemeigen cache: als de query hetzelfde is als een andere, gebruikt Tableau dezelfde resultaten. Dit is het laatste cacheniveau. Als dit mislukt, gaat Tableau naar de gegevens.
Cachefrequentie in Tableau
Tableau heeft beheerinstellingen voor het opslaan in cache, vaker of minder. Als de server is ingesteld op Minder vaak vernieuwen, bewaart Tableau gegevens gedurende maximaal 12 uur in de cache. Als de server is ingesteld op Vaker vernieuwen, keert Tableau terug naar de gegevens op elke paginavernieuwing.
Klanten die hetzelfde dashboard herhaaldelijk gebruiken, bijvoorbeeld 'Maandagochtend pijplijnrapporten', moeten zich op een server bevinden die minder vaak vernieuwen is ingesteld, zodat de dashboards allemaal dezelfde cache gebruiken.
Cachewarming in Tableau
In Tableau kunt u de cache vooraf op te warmen door een abonnement in te stellen zodat het dashboard verzonden wordt voordat u het wilt bekijken. (Het dashboard moet worden weergegeven om de e-mailafbeelding van het abonnement te genereren.) Zie De Tableau Server-cache opwarmen met behulp van abonnementen.
Tableau Desktop: Fout The drivers... are not properly installed
Probleem: Wanneer u Tableau Desktop probeert te verbinden met Databricks, wordt in Tableau een foutbericht weergegeven in het verbindingsdialoogvenster met een koppeling naar de downloadpagina van het stuurprogramma, waar u stuurprogrammakoppelingen en installatie-instructies kunt vinden.
Oorzaak: Bij de installatie van Tableau Desktop wordt geen ondersteund stuurprogramma uitgevoerd.
Oplossing: Download het Databricks ODBC-stuurprogramma versie 2.6.15 of hoger.
Zie ook: Fout 'De stuurprogramma's... zijn niet goed geïnstalleerd" op de Tableau-website.
Beperkingen voor primaire/refererende sleutels
Als u beperkingen van de primaire sleutel (PK) en refererende sleutel (FK) van Azure Databricks naar Tableau wilt doorgeven, moet u de mogelijkheden en beperkingen van beide platforms met betrekking tot beperkingen begrijpen.
Informatie over beperkingen voor Azure Databricks
Azure Databricks ondersteunt beperkingen voor primaire en refererende sleutels vanaf Databricks Runtime 15.2. Deze beperkingen zijn informatief en worden niet standaard afgedwongen, wat betekent dat ze schendingen van gegevensintegriteit niet voorkomen, maar kunnen worden gebruikt om query's te optimaliseren en metagegevens over gegevensrelaties te bieden. Zie Relaties tussen primaire sleutels en refererende sleutels declareren.
Begrijpen hoe Tableau gebruik maakt van beperkingen om tabelrelaties te creëren
Tableau dwingt geen primaire en externe sleutelbeperkingen rechtstreeks af. In plaats daarvan gebruikt Tableau relaties om gegevensverbindingen te modelleren. Als u wilt werken met beperkingen in Tableau, moet u begrijpen dat het gegevensmodel van Tableau twee niveaus van modellering biedt: een logische laag en een fysieke laag. Zie Tableau-gegevensmodel. De gevolgen van dit gegevensmodel op twee niveaus in Azure Databricks-beperkingen die worden herkend als relaties in Tableau, worden hieronder besproken.
Azure Databricks verbinden met Tableau
Wanneer u Azure Databricks verbindt met Tableau, probeert Tableau relaties te maken op de fysieke laag tussen tabellen op basis van bestaande sleutelbeperkingen en overeenkomende velden. Tableau probeert automatisch relaties op de fysieke laag te detecteren en te maken op basis van beperkingen voor primaire en refererende sleutels die zijn gedefinieerd in Azure Databricks. Als er geen sleutelbeperkingen zijn gedefinieerd, gebruikt Tableau overeenkomende kolomnamen om joins automatisch te genereren. Op de logische laag worden alleen overeenkomsten met één kolomnaam gebruikt om een relatie te bepalen. Op de fysieke laag detecteert deze kolomnaamkoppeling zowel eenvoudige (één kolom) als samengestelde sleutelrelaties (meerdere kolommen).
Als Tableau de overeenkomende velden niet kan bepalen, moet u handmatig de joinrelatie tussen de twee tabellen op de fysieke laag opgeven door de kolommen, voorwaarden en het type beperking op te geven. Als u van de logische laag in de gebruikersinterface naar de fysieke laag wilt overschakelen, dubbelklikt u op de tabel in de logische laag.