Kaj je Impala v velikih podatkih?
Kaj je Impala v velikih podatkih?

Video: Kaj je Impala v velikih podatkih?

Video: Kaj je Impala v velikih podatkih?
Video: ЛЮБОВЬ С ДОСТАВКОЙ НА ДОМ (2020). Романтическая комедия. Хит 2024, November
Anonim

Impala je odprtokodni poizvedbeni mehanizem za množično vzporedno obdelavo na vrhu gručenih sistemov, kot je Apache Hadoop. Ustvarjen je bil na podlagi Googlovega papirja Dremel. To je interaktivni poizvedbeni mehanizem, podoben SQL, ki deluje na vrhu Hadoop Distributed File System (HDFS). Impala uporablja HDFS kot osnovno shrambo.

V zvezi s tem, kaj je Impala in panj?

Apache panj je učinkovit standard za SQL-in-Hadoop. Impala je odprtokodni motor za poizvedbe SQL, razvit po Googlu Dremel. Cloudera Impala je motor SQL za obdelavo podatkov, shranjenih v HBase in HDFS. Impala uporablja panj megastore in lahko povpraša po panj mize neposredno.

Poleg tega, kateri je boljši panj ali Impala? Apache panj morda ni idealen za interaktivno računalništvo Impala je namenjen za interaktivno računalništvo. panj je paketno zasnovan Hadoop MapReduce, medtem ko Impala je več kot je MPP baza podatkov. panj podpira kompleksne tipe, vendar Impala ne. Apache panj je odporen na napake, medtem ko Impala ne podpira tolerance napak.

Vprašali smo tudi, zakaj uporabljamo Impalo?

Impala podpira obdelavo podatkov v pomnilniku, tj. dostopa do podatkov, ki jih analizira je shranjeni na podatkovnih vozliščih Hadoop brez premikanja podatkov. Ti lahko dostopni podatki z uporabo Impale z uporabo SQL-podobne poizvedbe. Impala zagotavlja hitrejši dostop do podatkov v HDFS v primerjavi z drugimi motorji SQL.

Kaj je panj v velikih podatkih?

Apache panj je podatkov skladiščni sistem za podatkov povzetek in analiza ter za poizvedovanje velikih podatkov sistemov v odprtokodni platformi Hadoop. Pretvori poizvedbe, podobne SQL, v opravila MapReduce za enostavno izvajanje in obdelavo izjemno velikih količin podatkov.

Priporočena: