NameNode kõrge kättesaadavus Quorum Journal Manageri abil



NameNode'i kõrge kättesaadavus on üks olulisemaid funktsioone Hadoop 2.0-s. NameNode'i kõrge kättesaadavus koos Quorum Journal Manageriga kasutatakse redigeerimislogide jagamiseks aktiivsete ja ooterežiimis olevate nimede vahel.

See on Hadoop 2.0 üks olulisemaid omadusi. Enne Namenode'i kõrge kättesaadavuse funktsiooni arutamist on oluline teada, mis on kvoorum. Kvoorum on üldine termin, mida kasutatakse klastrites, kus me ütleme, et konkreetne klaster on stabiilne. Kvoorum annab nimekirja masinatest ja aitab määrata klastri tervist. Kvoorumeid on kahte tüüpi: eeldatav kvoorum ja arvutatud kvoorum.





NameNode kõrge kättesaadavus Quorum Journal Manageri (QJM) abil

Enne Hadoop 2.0 oli NameNode HDFS-klastris üks rikkepunkt (SPOF). Igal klastril oli üks NameNode ja kui see masin polnud saadaval, ei oleks klaster tervikuna saadaval, kuni NameNode kas taaskäivitati või käivitati eraldi masinas. Klassikalises HA klastris on kaks eraldi masinat konfigureeritud kui NameNodes. Igal ajal on üks nimesõlmedest aktiivses olekus ja teine ​​ooterežiimis. Aktiivne NameNode vastutab klastri kõigi klienditoimingute eest, ooterežiimis on aga lihtsalt ori, säilitades piisavalt olekut kiire tõrkeotsingu tagamiseks.

Selleks, et ootesõlm säilitaks oma oleku kooskõlastatult aktiivse sõlmega, suhtlevad mõlemad sõlmed eraldi deemonite rühmaga nimega JournalNodes (JN). Kui aktiivne sõlm teostab mis tahes nimeruumi muutmise, logib see tehtud muudatuste kirjet JournalNodes. Ooterežiimisõlm suudab muudetud teavet JN-idelt lugeda ja jälgib neid regulaarselt muudatuste suhtes. Kuna ooterežiim näeb muudatusi, rakendab ta need seejärel oma nimeruumi. Tõrkesiirde korral veendub ooterežiim, et enne oleku muutmist aktiivseks olekuks on kõik JounalNodes muudatused läbi lugenud. See tagab nimeruumi oleku täieliku sünkroonimise enne tõrkeotsingu toimumist.



Kiire tõrkeotsingu tagamiseks on hädavajalik, et ootesõlmel oleks ajakohastatud ja ajakohane teave klastrite asukoha kohta klastris. Selleks juhtub, et DataNodes on konfigureeritud mõlema NameNode'i asukohaga ning saadab mõlemale ploki asukoha teabe ja südamelöögid.

On hädavajalik, et ainult üks nimesõlmedest oleks korraga aktiivne. Vastasel juhul kalduks nimeruumi olek nende kahe vahel kõrvale ja tooks kaasa andmete kadumise või ekslikke tulemusi. Selle vältimiseks lubab JournalNodes kirjutajale korraga ainult ühe NameNode'i. Tõrkesiirde ajal võtab aktiivseks muutuv NameNode vastutuse JournalNodes'ile kirjutamise eest.

Kas teil on meile küsimus? Palun mainige neid kommentaaride jaotises ja me võtame teiega ühendust.



kuidas teenust kohe kasutada

Seonduvad postitused:

Ülevaade Hadoop 2.0 klastriarhitektuuri föderatsioonist