Configurações de capacidade do driver para o driver ODBC do Databricks
Este artigo descreve como definir configurações de capacidade de driver especial e avançado para o driver ODBC Databricks.
O driver ODBC Databricks fornece as seguintes configurações especiais e avançadas de capacidade de driver.
- Definir o esquema inicial no ODBC
- Suporte a consultas ANSI SQL-92 em ODBC
- Extrair resultados de consulta grandes no ODBC
- Serialização de seta no ODBC
- Cloud Fetch em ODBC
- Ativar registo
Definir o esquema inicial no ODBC
O driver ODBC permite especificar o esquema definindo Schema=<schema-name>
como uma configuração de conexão. Isso equivale a executar USE <schema-name>
o .
Suporte a consultas ANSI SQL-92 em ODBC
O driver ODBC aceita consultas SQL no dialeto ANSI SQL-92 e traduz as consultas para o dialeto SQL Databricks. No entanto, se seu aplicativo gera Databricks SQL diretamente ou seu aplicativo usa qualquer sintaxe SQL padrão não-ANSI SQL-92 específica para o Azure Databricks, o Databricks recomenda que você defina UseNativeQuery=1
como uma configuração de conexão. Com essa configuração, o driver passa as consultas SQL literalmente para o Azure Databricks.
Extrair resultados de consulta grandes no ODBC
Para obter o melhor desempenho ao extrair resultados de consulta grandes, use a versão mais recente do driver ODBC que inclui as seguintes otimizações.
Serialização de seta no ODBC
O driver ODBC versão 2.6.15 e superior suporta um formato de serialização de resultados de consulta otimizado que usa a Seta Apache.
Cloud Fetch em ODBC
O Driver ODBC versão 2.6.17 e superior oferece suporte ao Cloud Fetch, um recurso que busca resultados de consulta por meio do armazenamento em nuvem configurado em sua implantação do Azure Databricks.
Os resultados da consulta são carregados em um local de armazenamento DBFS interno como arquivos serializados por seta de até 20 MB. Quando o driver envia solicitações de busca após a conclusão da consulta, o Azure Databricks gera e retorna assinaturas de acesso compartilhado para os arquivos carregados . Em seguida, o driver ODBC usa as URLs para baixar os resultados diretamente do DBFS.
O Cloud Fetch só é utilizado para resultados de consultas superiores a 1 MB. Resultados menores são recuperados diretamente do Azure Databricks.
O Azure Databricks coleta automaticamente os arquivos acumulados que são marcados para exclusão após 24 horas. Esses arquivos marcados são completamente excluídos após mais 24 horas.
Para saber mais sobre a arquitetura Cloud Fetch, consulte Como conseguimos conectividade de alta largura de banda com ferramentas de BI.
Ativar registo
Para ativar o registo de log no driver ODBC para Windows, configure os seguintes campos no Administrador de Fonte de Dados ODBC para o DSN correspondente:
- Defina o campo Nível de Log de FATAL para registar apenas eventos graves, passando por TRACE para registar todas as atividades do driver.
- Defina o campo Caminho do Log como o caminho completo para a pasta onde deseja guardar os ficheiros de log.
- Defina o campo
Número Máximo de Arquivos para o número máximo de arquivos de log a serem mantidos. - Defina o campo Tamanho Máximo do Arquivo para o tamanho máximo de cada arquivo de log em megabytes.
Para ativar o registo no driver ODBC para uma máquina que não seja Windows, defina as seguintes propriedades na string de conexão DSN ou sem DSN relacionada:
- Defina a propriedade
LogLevel
de1
para registrar somente eventos graves através de6
para registrar todas as atividades do driver. - Defina a propriedade
LogPath
para o caminho completo para a pasta onde você deseja salvar os arquivos de log. - Defina a propriedade
LogFileCount
para o número máximo de arquivos de log a serem mantidos. - Defina a propriedade
LogFileSize
para o tamanho máximo de cada arquivo de log em bytes.
Para obter mais informações, consulte as seções Configuring Logging Options on Windows
e Configuring Logging Options on a Non-Windows Machine
no Guia do driver JDBC do Databricks.