Hive tablosu (eski)
Önemli
Bu belge kullanımdan kaldırılmıştır ve güncelleştirilmeyebilir.
Bu makalede, dış tablo kullanarak bir Hive tablosunun bulut depolama alanından Azure Databricks'e nasıl içeri aktarılacağını gösterir.
Databricks, verileri depolamak veya düzenlemek için Hive tablolarının kullanılmasını önermez. Bu belgeler, dış sistemden veri geçirmek veya almak için var olan bir Hive tablosuna bağlantı yapılandırmanıza yardımcı olmak için sağlanır.
1. Adım: Deyimi gösterme CREATE TABLE
Tabloyu oluşturan deyimi görmek için Hive komut satırınızda bir SHOW CREATE TABLE <tablename>
komut verin.
hive> SHOW CREATE TABLE wikicc;
OK
CREATE TABLE `wikicc`(
`country` string,
`count` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'<path-to-table>'
TBLPROPERTIES (
'totalSize'='2335',
'numRows'='240',
'rawDataSize'='2095',
'COLUMN_STATS_ACCURATE'='true',
'numFiles'='1',
'transient_lastDdlTime'='1418173653')
2. Adım: Bir CREATE EXTERNAL TABLE
deyim verme
Döndürülen deyim bir CREATE TABLE
komut kullanıyorsa deyimini kopyalayın ve değerini ile CREATE TABLE
değiştirinCREATE EXTERNAL TABLE
.
-
EXTERNAL
tabloyu bırakırsanız Spark SQL'in verilerinizi silmemesini sağlar. - Alanı atlayabilirsiniz
TBLPROPERTIES
.
DROP TABLE wikicc
CREATE EXTERNAL TABLE `wikicc`(
`country` string,
`count` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'<path-to-table>'
3. Adım: Verilerinizde SQL komutları verme
SELECT * FROM wikicc