Tabel Apache Hive (warisan)
Penting
Dokumentasi ini telah dihentikan dan mungkin tidak diperbarui.
Artikel ini menunjukkan cara mengimpor tabel Apache Hive dari penyimpanan cloud ke Azure Databricks menggunakan tabel eksternal.
Databricks tidak merekomendasikan penggunaan tabel Apache Hive untuk menyimpan atau mengatur data. Dokumentasi ini disediakan untuk membantu Anda mengonfigurasi koneksi ke tabel Apache Hive yang ada untuk memigrasikan atau menyerap data dari sistem eksternal.
Langkah 1: Tampilkan CREATE TABLE
pernyataan
Keluarkan perintah SHOW CREATE TABLE <tablename>
pada baris perintah Apache Hive Anda untuk melihat pernyataan yang membuat tabel.
hive> SHOW CREATE TABLE wikicc;
OK
CREATE TABLE `wikicc`(
`country` string,
`count` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'<path-to-table>'
TBLPROPERTIES (
'totalSize'='2335',
'numRows'='240',
'rawDataSize'='2095',
'COLUMN_STATS_ACCURATE'='true',
'numFiles'='1',
'transient_lastDdlTime'='1418173653')
Langkah 2: Keluarkan CREATE EXTERNAL TABLE
pernyataan
Jika pernyataan yang dikembalikan menggunakan perintah CREATE TABLE
, salin pernyataan tersebut dan ganti CREATE TABLE
dengan CREATE EXTERNAL TABLE
.
-
EXTERNAL
memastikan bahwa Spark SQL tidak menghilangkan data Anda jika Anda menjatuhkan tabel. - Anda dapat menghilangkan bidang
TBLPROPERTIES
.
DROP TABLE wikicc
CREATE EXTERNAL TABLE `wikicc`(
`country` string,
`count` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'<path-to-table>'
Langkah 3: Keluarkan perintah SQL pada data Anda
SELECT * FROM wikicc