OLTP vs OLAP



Järgmises ajaveebis räägitakse lühidalt OLTP vs OLAP-st ja erinevatest kasutusjuhtumitest.

OLTP vs OLAP

Väidetavalt on OLTP pigem veebitehingute süsteem või andmesalvestussüsteem, kus kasutaja teeb andmepoe abil palju veebitehinguid. Väidetavalt toimub ka reaalajas rohkem ad-hoc lugemisi / kirjutusi.





OLAP on pigem võrguühenduseta andmepood. Sellele pääseb juurdekordade arvvõrguühenduseta. Näiteks loetakse hulgilogifailid ja kirjutatakse need seejärel tagasi andmefailidesse. Mõned levinumad kohad, kus OLAP-i kasutatakse, on logitööd, andmekaevandustööd jne.

Väidetavalt on Cassandra pigem OLTP, kuna see on reaalajas, samas kui Hadoop on pigem OLAP, kuna seda kasutatakse analüüsi ja hulgikirjutuste jaoks.



Miks integreerida OLAP ja OLTP?

Kui otsite järgmise 365 päeva jooksul hotellibroneeringute jaoks odavaimat hinda, on siin Cassandra kohta tohutu andmekogum ja soovite saada soovitusi reaalajas andmebaasi kohta, korraldatakse promo hinnapõhiselt.

Sellise stsenaariumi korral peame kõik dokumendid kordama ja selle peal hoidma analüütikat, mis on tohutu võrguühenduseta töö, mida tuleb sageli alustada. Siin hakkab Hadoop mängima hulgi andmete krigistamist.

pl / sql erandite käitlemine

Teine eelis on see, et saame käitada ühte klastrit ja katkestada teise Hadoopi klastri käitamise.



Kolmas eelis on see, et saab vähendada ka palju operatsioonikulusid.

Arvestades stsenaariumi, kus juhul, kui kasutaja on hästi kursis erinevate Hadoopi ökosüsteemidega, nagu Hive, Pig Latin ja peab sellesse andmed integreerima, tuleb Cassandrasse lisada mõni andmeallikas ja proovida käivitada Map Vähendage ka töökohti.

OLTP ja OLAP vahel on märgatav muster. OLTP-s on vähem kirjutusi, nt. Hotelliteave. Eeldades, et hinna muutused toimuvad iga 5000 korra sekundis, võib lugemisi siin rohkem olla. Sellise stsenaariumi korral võib kirjutamine olla 1 sekundis, kuid lugemiste arv võib ulatuda sadade ja tuhandeteni. Nii et suhe on siin umbes 1: 1000.

On huvitav tähelepanek, et Cassandra mahub sellesse mudelisse hõlpsasti, mis sisaldab mudeleid, kus lugemine / kirjutamine on võrdne. Isegi kui rääkida OLTP-st, isegi kui satutakse häälestatavasse ja tugevasse järjepidevuse mudelisse, võib näha millisekundilist lõhet võimalike järjepidevate mudelite ja kõige tugevamate ühtsete mudelite vahel. Seega mahub Cassandra OLTP-sse.

OLAP-i juurde tulles on näha erinevaid OLAP-i mustreid, mis tähendab, et samaaegselt toimub mitu kirjutamist. OLAP-is ladustame andmed ühe kaadrina, st kõik logifailid pannakse andmepoodi ja siis hakkame töötlema. Andmemuster või juurdepääsumuster on täpselt vastupidine OLTP tüüpi rakendustele. Siin on kasulik Hadoop või MapReduce.

Kas teil on meile küsimus? Mainige neid kommentaaride jaotises ja me võtame teiega ühendust.

Seonduvad postitused:

kuidas Pythonis objekti initsialiseerida

Viis peamist põhjust Cassandra õppimiseks