Kako je v Hadoopu dosežena lokalizacija podatkov?
Kako je v Hadoopu dosežena lokalizacija podatkov?

Video: Kako je v Hadoopu dosežena lokalizacija podatkov?

Video: Kako je v Hadoopu dosežena lokalizacija podatkov?
Video: Урок 55: "Основы работы с данными основы Hive" 2024, Maj
Anonim

Lokalizacija podatkov v Hadoop . Vzemite vzorčni primer štetja besed, kjer se je večina besed ponovila 5 laks ali večkrat. V tem primeru bo po fazi Mapperja vsak izhod preslikava imel besede v obsegu 5 Lacs. Ta celoten postopek shranjevanja izhoda Mapperja v LFS se imenuje kot Lokalizacija podatkov.

Glede na to, kaj je lokalizacija podatkov v Hadoopu?

Koncept oz Podatki kraj v Podatki Hadoop kraj v MapReduce se nanaša na zmožnost premikanja izračuna blizu dejanskega mesta podatkov se nahaja na vozlišču, namesto da se premika veliko podatkov na računanje. To zmanjša preobremenjenost omrežja in poveča celotno prepustnost sistema.

In kako se shranijo veliki podatki? Večina ljudi samodejno poveže HDFS ali porazdeljeni datotečni sistem Hadoop s Hadoopom podatkov skladišča. HDFS shranjuje informacije v gruče, ki so sestavljene iz manjših blokov. Ti bloki so shranjeni v fizičnem na terenu skladiščenje enote, kot so notranji diskovni pogoni.

Samo tako, kako so podatki shranjeni v Hadoopu?

Na a Hadoop grozd, podatkov znotraj HDFS in sistem MapReduce sta nameščena na vsakem stroju v gruči. Podatki je shranjeni v podatkov blokov na podatkovnih vozliščih. HDFS jih posnema podatkov blokov, običajno velikih 128 MB, in jih porazdeli tako, da se replicirajo v več vozliščih v gruči.

Kako so datoteke shranjene v HDFS?

HDFS izpostavlja a mapa sistemski imenski prostor in omogoča, da so uporabniški podatki shranjeni v datoteke . Interno, a mapa je razdeljen na enega ali več blokov in ti bloki so shranjeni v nizu podatkovnih vozlišč. NameNode se izvede mapa operacije sistemskega imenskega prostora, kot so odpiranje, zapiranje in preimenovanje datoteke in imeniki.

Priporočena: