Tarude andmemudelid



Taru andmemudelid sisaldavad järgmisi komponente, nagu andmebaasid, tabelid, vaheseinad ja ämbrid või klastrid. Taru toetab primitiivseid tüüpe nagu täisarvud, ujukid, kahekordsed ja stringid.

Hive on Hadoopi jaoks mõeldud andmelao süsteem, mis hõlbustab andmete hõlpsat kokkuvõtet, ad-hoc päringuid ja Hadoopiga ühilduvates failisüsteemides salvestatud suurte andmekogumite analüüsi. Taru struktureerib andmed hästi mõistetavateks andmebaasikontseptsioonideks nagu tabelid, read, veerud ja vaheseinad. See toetab primitiivseid tüüpe nagu täisarvud, ujukid, kahesed ja stringid. Hive toetab ka assotsiatiivseid massiive, loendeid, struktuure ning andmete ja tabelitesse teisaldamiseks kasutatakse seeriat ja deserialiseeritud API-d.





HTML-tabel tabelis

Vaatame üksikasjalikult tarude andmemudeleid

Taru andmemudelid:

Taru andmemudelid sisaldavad järgmisi komponente:



  • Andmebaasid
  • Tabelid
  • Vaheseinad
  • Ämbrid või kobarad

Vaheseinad:

Jaotus tähendab tabeli jagamist jämedakoeliseks osaks, lähtudes jaotise veeru väärtusest, näiteks ‘andmed’. See muudab andmete viilude kohta päringute esitamise kiiremaks

mis on java mvc

Tarude andmemudelid

Niisiis, mis on partitsiooni funktsioon? Jaotusklahvid määravad andmete salvestamise viisi. Siin määratleb partitsioonivõtme iga kordumatu väärtus tabeli partitsiooni. Vaheseinad on mugavuse huvides nimetatud kuupäevade järgi. See sarnaneb HDFS-i blokeerimisega.



Kopad:

Ämbrid annavad täiendava struktuuri andmetele, mida võidakse kasutada tõhusate päringute jaoks. Kahe samades veergudes asetseva tabeli ühendamist, sealhulgas liitumisveergu, saab rakendada kaardipoolse liitumisena. Kasutatava ID abil kogumine tähendab, et saame kasutajapõhist päringut kiiresti hinnata, käivitades selle kõigi kasutajate hulga randomiseeritud valimi põhjal.

Kas teil on meile küsimus? Palun mainige neid kommentaaride jaotises ja me võtame teiega ühendust.

Seonduvad postitused:

sorteeri c ++ massiiv

Kasulikud taru käsud