Kaj je AWS MapReduce?
Kaj je AWS MapReduce?

Video: Kaj je AWS MapReduce?

Video: Kaj je AWS MapReduce?
Video: Shrinathji Ni Zakhi 1 - Shrinathji Na Bhajan 2024, Maj
Anonim

Amazon Elastic MapReduce (EMR) je Amazonova spletna storitev ( AWS ) orodje za obdelavo in analizo velikih podatkov. Amazon EMR obdeluje velike podatke v gruči navideznih strežnikov Hadoop v Amazon Elastic Compute Cloud (EC2) in Amazon Simple Storage Service (S3).

Kako na ta način deluje AWS EMR?

Storitev zažene število primerkov Amazon EC2, ki jih določi stranka, sestavljeno iz enega glavnega in več drugih vozlišč. Amazon EMR v teh primerih izvaja programsko opremo Hadoop. Glavno vozlišče razdeli vhodne podatke na bloke in porazdeli obdelavo blokov na druga vozlišča.

Poleg zgoraj, kakšna je razlika med ec2 in EMR? Za razliko od EMR , EC2 ne kategorizira podrejenih vozlišč v jedro in vozlišča opravil. To poveča tveganje izgube podatkov HDFS v primeru odstranitve/izgube vozlišča. EC2 uporablja knjižnice Apache (s3a) za dostop do podatkov na s3. Po drugi strani, EMR uporablja lastniško kodo AWS za hitrejši dostop do s3.

Poleg tega je AWS EMR v celoti upravljan?

Amazon Elastic MapReduce ( EMR ) je v celoti upravljano Hadoop in platforma Spark iz Amazon Spletna storitev ( AWS ). Z EMR , AWS stranke lahko hitro razvijejo gruče Hadoop z več vozlišči za obdelavo velikih podatkovnih obremenitev.

Ali AWS uporablja Hadoop?

Amazon Spletne storitve uporablja odprtokodni Apache Hadoop porazdeljeno računalniško tehnologijo za lažji dostop do velikih količin računalniške moči za izvajanje podatkovno intenzivnih nalog. Hadoop , odprtokodno različico Googlovega MapReduce, že uporabljajo podjetja, kot sta Yahoo in Facebook.

Priporočena: