Bagikan melalui


Tabel Apache Hive (warisan)

Penting

Dokumentasi ini telah dihentikan dan mungkin tidak diperbarui.

Artikel ini menunjukkan cara mengimpor tabel Apache Hive dari penyimpanan cloud ke Azure Databricks menggunakan tabel eksternal.

Databricks tidak merekomendasikan penggunaan tabel Apache Hive untuk menyimpan atau mengatur data. Dokumentasi ini disediakan untuk membantu Anda mengonfigurasi koneksi ke tabel Apache Hive yang ada untuk memigrasikan atau menyerap data dari sistem eksternal.

Langkah 1: Tampilkan CREATE TABLE pernyataan

Keluarkan perintah SHOW CREATE TABLE <tablename> pada baris perintah Apache Hive Anda untuk melihat pernyataan yang membuat tabel.

hive> SHOW CREATE TABLE wikicc;
OK
CREATE  TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

Langkah 2: Keluarkan CREATE EXTERNAL TABLE pernyataan

Jika pernyataan yang dikembalikan menggunakan perintah CREATE TABLE, salin pernyataan tersebut dan ganti CREATE TABLE dengan CREATE EXTERNAL TABLE.

  • EXTERNAL memastikan bahwa Spark SQL tidak menghilangkan data Anda jika Anda menjatuhkan tabel.
  • Anda dapat menghilangkan bidang TBLPROPERTIES.
DROP TABLE wikicc
CREATE EXTERNAL TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'

Langkah 3: Keluarkan perintah SQL pada data Anda

SELECT * FROM wikicc