Kuidas tarude skripte käivitada?



See on õpetus tarude skriptide käitamiseks. Selle skripti käivitamine vähendab iga käsu käsitsi kirjutamise ja täitmise aega ja vaeva.

Kuna Apache Hive on Hadoopi peale ehitatud andmehoidla pakett, kasutatakse seda üha enam andmete analüüsimiseks, andmete kaevandamiseks ja ennustavaks modelleerimiseks. Organisatsioonid otsivad kindlalt kinni hoidvaid spetsialiste . Selles postituses vaatame, kuidas käitada tarude skripte. Üldiselt kasutame skripte avalduste komplekti korraga täitmiseks. Tarude skripte kasutatakse üsna samamoodi. See vähendab iga käsu käsitsi kirjutamise ja täitmise aega ja vaeva.

Hive'i skripte toetatakse Hive 0.10.0 ja uuemates versioonides. Kuna Hive 0.90 versioon on CDH3-sse installitud, ei saa me Hive-skripte CDH3-s käivitada. CDH4-s saate proovida järgmisi samme, kuna sellesse on installitud Hive 0.10.0 versioon. Kas olete teadlik sellest, kuidas luua taru skript? Kui ei, klõpsake nuppu et saada rohkem selgust.





Master-Hive-Now

Vaatame nüüd, kuidas kirjutada taru skriptid ja käivitada need CDH4-s:



1. samm: taru skripti kirjutamine.

Taru skripti kirjutamiseks tuleks fail salvestada laiendiga .sql. Avage oma Cloudera CDH4 jaotises terminal ja andke Hive'i skripti loomiseks järgmine käsk.
Käsk: sudo gedit sample.sql

Ülaltoodud käsu käivitamisel avab see faili kõigi Hive'i käskude loendiga, mis tuleb täita.



Selles skriptis luuakse, kirjeldatakse tabelit ning laaditakse ja saadakse tabelist andmeid.

1. Tarus tabeli loomine:

Käsk: luua tabelitoode (productid: int, tootenimi: string, hind: ujuk, kategooria: string) ridade vormingus eraldatud väljad, mis on lõpetatud tähega ','

Siin on toode tabeli nimi ja {productid, tootenimi, hind, kategooria} on selle tabeli veerud.

Väljad, mis on lõpetatud tähega ', näitavad, et sisendfaili veerud on eraldatud sümboliga', '.

Vaikimisi eraldatakse sisendfaili kirjed uue reaga.

2. Tabeli kirjeldamine:

nukk vs peakokk vs dokk

Käsk: kirjeldage toodet

3. Andmete laadimine tabelisse.

Andmete tabelisse laadimiseks peame kõigepealt looma sisendfaili, mis sisaldab tabelisse sisestatavaid kirjeid.

Loogem sisendfail.

Käsk: sudo gedit input.txt

Redigeerige faili sisu, nagu on näidatud joonisel.

4. Andmete hankimine:

Andmete hankimiseks kasutatakse käsku select.

Käsk: Valige tootest *

Ülaltoodud käsku kasutatakse kõigi tabelis olevate veergude väärtuse hankimiseks. Skript peaks olema selline, nagu on näidatud alloleval pildil.

Nüüd oleme taru käsikirja kirjutamisega lõpetanud. Faili sample.sql saab nüüd salvestada.

2. samm: taru skripti käitamine

Järgmine on käsk Hive'i skripti käivitamiseks:

Käsk: taru –f /home/cloudera/sample.sql

sorteeri c ++

Skripti käivitamise ajal veenduge, et skriptifaili asukoha kogu tee oleks olemas.

Näeme, et kõik käsud täidetakse edukalt.

Nii käivitatakse ja käivitatakse Hive'i skriptid CDH4-s.

Taru on Hadoopi kriitiline komponent ja teie kogemused tarus võivad tuua teile kõige paremini tasustatavaid Hadoopi töökohti! Edurekal on spetsiaalselt kureeritud Hadoopi kursus, mis aitab teil omandada selliseid mõisteid nagu MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume ja Sqoop. Alustamiseks klõpsake allolevat nuppu.

Kas teil on meile küsimus? Palun mainige neid kommentaaride jaotises ja me võtame teiega ühendust.

Seonduvad postitused:

Taru käsud

Tarude andmemudelid