Hive on Hadoopi jaoks mõeldud andmelao süsteem, mis hõlbustab andmete hõlpsat kokkuvõtet, ad-hoc päringuid ja Hadoopiga ühilduvates failisüsteemides salvestatud suurte andmekogumite analüüsi. Taru struktureerib andmed hästi mõistetavateks andmebaasikontseptsioonideks nagu tabelid, read, veerud ja vaheseinad. See toetab primitiivseid tüüpe nagu täisarvud, ujukid, kahesed ja stringid. Hive toetab ka assotsiatiivseid massiive, loendeid, struktuure ning andmete ja tabelitesse teisaldamiseks kasutatakse seeriat ja deserialiseeritud API-d.
HTML-tabel tabelis
Vaatame üksikasjalikult tarude andmemudeleid
Taru andmemudelid:
Taru andmemudelid sisaldavad järgmisi komponente:
- Andmebaasid
- Tabelid
- Vaheseinad
- Ämbrid või kobarad
Vaheseinad:
Jaotus tähendab tabeli jagamist jämedakoeliseks osaks, lähtudes jaotise veeru väärtusest, näiteks ‘andmed’. See muudab andmete viilude kohta päringute esitamise kiiremaks
mis on java mvc
Niisiis, mis on partitsiooni funktsioon? Jaotusklahvid määravad andmete salvestamise viisi. Siin määratleb partitsioonivõtme iga kordumatu väärtus tabeli partitsiooni. Vaheseinad on mugavuse huvides nimetatud kuupäevade järgi. See sarnaneb HDFS-i blokeerimisega.
Kopad:
Ämbrid annavad täiendava struktuuri andmetele, mida võidakse kasutada tõhusate päringute jaoks. Kahe samades veergudes asetseva tabeli ühendamist, sealhulgas liitumisveergu, saab rakendada kaardipoolse liitumisena. Kasutatava ID abil kogumine tähendab, et saame kasutajapõhist päringut kiiresti hinnata, käivitades selle kõigi kasutajate hulga randomiseeritud valimi põhjal.
Kas teil on meile küsimus? Palun mainige neid kommentaaride jaotises ja me võtame teiega ühendust.
Seonduvad postitused:
sorteeri c ++ massiiv