Apache Drill on valdkonna esimene skeemivaba SQL Engine. Drill ei ole maailma esimene päringumootor, kuid see on esimene, mis tagab peene paindlikkuse ja kiiruse tasakaalu. Drill on loodud mitme tuhande sõlmeni ja petabaitide andmete päringuteks interaktiivse kiirusega, mida BI / Analyticsi keskkond nõuab.
Seda saab integreerida mitme andmeallikaga, nagu Hive, HBase, MongoDB, failisüsteem, RDBMS. Samuti saab Drillis hõlpsalt kasutada sisendvorminguid nagu Avro, CSV, TSV, PSV, Parkett, Hadoop Sequence'i failid ja paljusid muid faile.
Miks Apache Drill?
Apache Drilli suurim eelis on see, et see suudab skeemi lennult avastada, kui küsite mis tahes andmeid. Lisaks saab parema analüüsi jaoks töötada teie BI-tööriistadega nagu Tableau, Qlikview, MicroStrategy jne.
Siin on üks tööstusanalüütiku tsitaat, mis võtab kokku Apache Drilli väärtuse:
„Drill ei puuduta ainult SQL-on-Hadoopi. See puudutab SQL-i, peaaegu kõike, kohe ja formaalsusteta. '
- Andrew Burst, Gigaom Research, jaanuar 2015
Drillbit on Apache Drilli deemon, mis töötab klastri igas sõlmes. See kasutab kogu klastri suhtlemiseks ja klastri liikmelisuse hooldamiseks ZooKeeperit. See vastutab kliendilt päringute vastuvõtmise, päringute töötlemise ja tulemuste tagastamise eest kliendile. Kliendilt päringu saanud drillbit nimetatakse töödejuhatajaks. See genereerib täitmisplaani, täitmisfragmendid saadetakse teistele klastris töötavatele puurbittidele.
Veel üks eelis on see, et külviku paigaldamine ja seadistamine on üsna lihtne. Õppige, kuidas Apache Drilli installida.
Esimene samm on puuripaketi allalaadimine.
kuidas installida PHP 7 Windowsi 10
Käsk: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz
Käsk: tar -xvf apache-drill-1.5.0.tar.gz
Käsk: ls
Järgmisena määrake keskkonnamuutujad .bashrc-failis.
Käsk: sudo gedit .bashrc
eksportige DRILL_HOME = / home / edureka / apache-drill-1.5.0
eksport PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin
See käsk värskendab muudatusi:
Käsk: allikas .bashrc
Nüüd minge conf-kataloogi puurimiseks ja redigeerige faili drill-override.conf koos klastri ID ja zookeeper host & portiga, käivitame selle kohalikus klastris.
Käsk: cd apache-drill-1.5.0
Käsk: sudo gedit conf / drill-override.conf
Vaikimisi on DRILL_MAX_DIRECT_MEMORY failis drill-env.sh 8 GB ja me peame seda hoidma vastavalt olemasolevale mälule.
Käsk: sudo gedit conf / drill-env.sh
Puuri installimiseks ainult ühte sõlme saate kasutada manustatud režiimi, kus see töötab kohapeal. Selle käsu käivitamisel käivitatakse see automaatselt drillbit-teenus.
Käsk: ./bin/drill-embedded
Installimise kontrollimiseks võite käivitada lihtsa päringu.
Käsk: vali * sys.options seast WHERE type = ‘SYSTEM’ ja nimeks näiteks ‘security%’
Apache Drilli veebikonsooli kontrollimiseks peame minema veebibrauseris saidile localhost: 8047.
Päringu saate käivitada ka vahekaardil Päring.
java operaatori võimule
Drilli käitamiseks hajutatud režiimis peate muutma klastri ID-d ja lisama ZooKeeperi teabe drill-override.conf-is allpool toodud viisil.
Seejärel peame igas sõlmes käivitama teenuse ZooKeeper. Pärast seda peate selle käsuga käivitama iga sõlme drillbit-teenuse.
Käsk: ./bin/drillbit.sh algus
Käsk: jps
Nüüd kasutame puurimiskesta käivitamiseks käsku allpool.
Nüüd saame klastris oma päringuid hajutatud režiimis täita.
See on esimene ajaveebipostitus kaheosalises Apache Drilli ajaveebisarjas. Sarja teine blogi on varsti tulemas.
Kas teil on meile küsimus? Mainige neid kommentaaride jaotises ja me võtame teiega ühendust.
Seonduvad postitused: